Обработка аудио для ютуба и стримов: как сделать дикторский голос программными средствами

Общие советы

Стоит сразу оговориться: хорошего результата не получится без хороших «сырцов» — исходный материал должен быть качественным. В идеале, речь должна не только записываться на хороший микрофон и звуковую карту, но и быть начитанной с дикцией, произношением, интонациями, выразительностью, характером, манерой и правильным дыханием. Возможные дефекты речи — ярко выраженная картавость или гнусавость — обработкой не исправляются.

Идеально, если речь записана в акустически обработанной комнате. Если таковой нет, можно обойтись акустическим экраном для микрофона. Расстояние до микрофона индивидуально и зависит от громкости голоса, экспрессии и динамики. Главное, чтобы не было перегрузов или откровенно тихого сигнала. Оптимальное значение — от -18 до -12 дБ.

На микрофоне обязательно должна быть либо ветрозащита, либо поп-фильтр. Взрывные согласные сложно поддаются компьютерной обработке, так что лучше приобрести недорогой аксессуар, который избавит от большинства проблем с ними.

Обрабатываем звук для оффлайн-видео

Итак, голос записан, и теперь нужно его обработать.

Начать стоит счистки материала: убрать все шумы в паузах, если необходимо — вдохи, вздохи и другие артефакты. Можно сделать все вручную, а можно поставить нойз-гейт. Он должен находится в самом начале цепи обработки. Настроить гейт очень просто: параметр threshold означает порог его срабатывания, здесь нужно взять самый громкий участок с шумами и сделать уровень thrershold чуть выше его.

Следующий шаг — шумоподавление. Нужно найти участок записи без какого-либо сигнала, чтобы на нем присутствовал только шум цепи звукозаписи. Если уровень шума ниже 50 дБ (как на скриншоте выше) — можно смело махнуть на него рукой и не делать ничего, такой шум никто не услышит. Если шум явно заметен, можно использовать специальные плагины (например, reafir от Reaper или denoiser в Cubase) для его удаления, либо подрезать эквалайзером пару самых шумных частот — точно так же, как будут удалятся резонансы в следующем пункте.

Фильтрация и удаление резонансов. Бывает, что низкий мужской голос начинает неприятно бубнить в районе 100–200 Гц, либо высокий женский тембр в сочетании с не самым лучшим микрофоном неприятно режет по ушам. Так и проявляются резонансы. Избавиться от них просто: нужно поставить в цепь обработки эквалайзер и узкой полосой с большим усилением (10–30 дБ) “пройтись” по всему частотному спектру, вычисляя самые неприятные места с режущим ухо свистом, звоном или гудением.

Поиск и подрезание резонанса

Помимо этого, можно вовсе удалить целые куски спектра, в которых нет никакого полезного сигнала. Это делается с помощью low-pass и hi-pass фильтров, которые обрезают высокие и низкие частоты соответственно.

Предлагаем ознакомиться  Как делается интимная смазка своими руками?

●     Ниже 75–100 Гц — здесь находится, в основном, низкочастотный бубнящий шум. Можно смело применить hi-pass фильтр и обрезать все до этих значений.

●     100–150 Гц — тут нередко находятся гудящие частоты, особенно это касается мужского вокала, записанного в небольшой комнате. Можно подрезать их узкой полосой.

●     800–1000 Гц — здесь может располагаться «гундосый» назальный тон, который также имеет смысл подрезать узкой полосой.

●     4–9 кГц — тут находятся сибилянты — шипящие согласные звуки «с-с-с», «ш-ш-ш», «щ-щ-щ», которые могут неприятно свистеть при записи. Для борьбы с ними обычно используется деэссер — специальный прибор, который смягчает резкость свистящих согласных. Но можно не заморачиваться, найти самую неприятную частоту и также подрезать ее узкой полосой.

●     Выше 16 кГц — в человеческой речи редко присутствует что-то полезное выше этой частоты, так что можно смело применять low-pass фильтр.

Так выглядит эквалайзер после вырезания резонансов и ненужных частот

●     180–240 Гц — прибавление 3–5 дБ широкой полосой в этой области сделает мужскую речь более полной и читаемой. Для женской речи это будет 200–300 Гц.

●     1.5–2 — 5 кГц — это самый важный диапазон для голоса, так называемая область разборчивости. Человеческий слух наиболее чувствителен именно к этим частотам, стоит прибавить их широкой полосой на 3–8 дБ.

●     9–11 кГц — эти частоты отвечают за яркость голоса. Их очень часто не хватает в речи, записанной даже на студийный микрофон, особенно в заглушенной комнате, которая с аппетитом пожирает верха вокала. Нередко приходится значительно прибавлять этот диапазон — на 6–12 дБ, чтобы придать речи ясности. Но нужно следить за шипящими согласными.

●     Выше 12 кГц — это область «воздуха», поднятие которой позволит сделать речь более натуральной и яркой. Обычно для этой и предыдущей области частот используется параметр эквалайзера hi-shelf, который выглядит как «планка» и позволяет моментально «осветлить» голос.

При эквализации низких частот лучше использовать узкие полосы, а при высоких — широкие, это сделает работу эквалайзера менее заметной.

●     Ratio: 4:1 (таким образом, если сигнал превышает порог на 4 дБ, то он скомпрессируется до 1 дБ выше порога)

Предлагаем ознакомиться  Как называется анализ крови на рак простаты

●     Attack: как правило, для голоса хорошо работает быстрая атака в районе 5–10 мс, она позволяет компрессору срабатывать мгновенно. Если при этом компрессия начинает съедать согласные — атаку нужно увеличить.

●     Release: если в компрессоре есть функция авторелиз, можно ей и воспользоваться. Если нет — начать стоит с 40–50 мс.

Обработка аудио для ютуба и стримов: как сделать дикторский голос программными средствами

●     Output или make-up: если в компрессоре есть функция автомейкапа, можно применить ее. В противном случае компенсацию громкости можно выполнить вручную на слух — главное, чтобы итоговый сигнал не попадал в красную зону.

●     Threshold: здесь нужно смотреть по уровню громкости исходного трека. Начать можно с -8 дБ.

Есть проверенный метод настройки компрессора «на слух» для новичков: нужно выкрутить ratio и threshold на максимум, attack и release — на минимум. Так будет лучше слышно, что прибор делает с сигналом. Далее подбирается атака, потом релиз, а параметрами ratio и threshold регулируется уровень до желаемых значений.

Лимитеринг. Это операция позволяет ограничить максимальный уровень громкости. Сигнал на мастер-шине не должен зашкаливать, и лимитер выступает в роли очень жесткого компрессора, который не позволяет сигналу выбраться за пределы установленного значения. Как правило, среднее арифметическое уровня сигнала (RMS) должно быть около -16 дБ.

Лимитер и компрессор в роли лимитера

Если фоновая музыка в видео заглушает речь, нужно выставить RMS музыки и RMS голоса одинаковыми, после чего убавить музыку на 5–10 дБ. Если в некоторых местах слова все еще неразборчивы, можно применить к музыкальной подложке эквализацию. Достаточно посмотреть на эквалайзер для речи и сделать все наоборот в эквалайзере для музыки: например, если в речи 5 кГц приподнято широкой полосой, то в музыке эти же 5 кГц нужно убавить.

У стримов и подкастов есть своя специфика при обработке голоса — здесь важно, чтобы плагины не были ресурсоемкими и не сильно грузили компьютер. Поэтому стоит использовать минимально необходимый набор эффектов.

Предлагаем ознакомиться  Что делать, если болит ухо внутри у взрослого?

Чаще всего для стримов используется программа OBS Studio. В ней можно загружать точно те же VST-плагины для обработки звука, что и в DAW. Если используется не OBS Studio, то для обработки голоса можно воспользоваться отдельной программой для потоковой обработки звука VSTHost, она работает с любыми приложениями для стримов.

Так выглядит плагин ReaFIR в OBS Studio

1. Шумоподавление. В отличие от оффлайн-видео, звук к которым нередко записывается отдельно на качественный микрофон, в стримах часто используется не самое лучшее оборудование. Недорогой микрофон вкупе со встроенной звуковой картой и включенной функцией Microphone Boost в настройках звука Windows будут сильно шуметь.

2. Гейт. Если в звуке для оффлайн-видео можно вручную вырезать все крики детей за окном и рев соседского перфоратора за стеной, то с онлайном такой фокус не провернуть. Понадобится гейт.

●     Release можно сделать длинным, около 200 мс, поскольку работа гейта будет слишком слышна при быстром релизе. Правильно настроенный гейт почти незаметен для слушателя и удаляет лишь шумы и призвуки в паузах между фразами.

●     Уровень гейта нужно сделать чуть выше, чем фоновый шум, не стоит выставлять уровень рядом с уровнем голоса.

●     Простой способ настройки гейта для речи — нужно сложить губы трубочкой и шумно выдохнуть воздух в сторону от микрофона, запомнить на индикаторе значение уровня этого шума и выставить его на гейте.

Дайте послушать результаты!

Разобраться в обработке звука по тексту бывает непросто, но результат того стоит. Смотрите сами. Точнее, слушайте.

Обработка аудио для ютуба и стримов: как сделать дикторский голос программными средствами

Качественный звук в современных видео и стримах значит ничуть не меньше, чем видео в высоком разрешении. А порой и больше — ведь многие ставят ролики на фон, смотря их вполглаза и воспринимая происходящее в основном на слух.

При этом стоит учесть, что данное руководство дает лишь базовые настройки в качестве точки отсчета. Конечный результат должен подбираться аудиально, ведь главный инструмент в работе звукорежиссера — это его собственные уши.

Оцените статью
Мужская психология
Adblock detector