Особенности сведения и мастеринга для сервисов цифровой дистрибуции и стримингов
На протяжении десятилетий многие производители музыкальной индустрии и звукоинженеры были вовлечены в настоящую гонку вооружений. С момента зарождения музыки как продукта средств массовой информации, перенесенного на винил, до революции компакт-дисков целью многих в индустрии было сделать каждый трек как можно громче — громче предыдущего и достаточно громким, чтобы конкурировать с песнями на радио. Война за громкость обострялась до 2010 года, когда был внедрён новый стандарт AES/EBU, призванный внести изменения в пользу более тихого материала.
Сегодняшние музыкальные стандарты потоковой передачи данных оставляют гораздо меньше стимулов для музыкантов заполнять звуком весь доступный динамический диапазон. Такие платформы, как YouTube, Spotify и Apple Music, анализируют загруженный трек, приглушая тот, который «слишком горячий», и добавляя громкости более спокойным, плавным композициям с большей динамикой.
Для слушателей результатом является гораздо более удобное прослушивание плейлистов. За дэт-метал треком может последовать плавная джазовая мелодия, и теоретически не нужно будет трогать регулятор громкости — разница в средней громкости двух песен будет компенсирована стриминговым сервисом за кулисами незаметно для пользователя.
Для инженеров и звукорежиссёров этот новый подход к громкости означает, что мастеринг становится более щадящим по отношению к материалу процессом. Вместо того чтобы сосредотачиваться на коммерчески выгодном повышении громкости трека, больше времени выделяется для подчёркивания нюансов и динамики в музыке. Но как на самом деле работают эти стандарты?
Вы наверняка слышали термины «пик» и «среднеквадратичное значение», когда речь идет об уровне аудиосигнала. Пик – мгновенное максимальное значение сигнала – наивысшая точка, которой он достиг; в то время как RMS обеспечивает значение среднего уровня сигнала с течением времени. Среднеквадратичное значение дает хорошее представление о том, как люди воспринимают громкость; Пик, как правило, даёт представление о максимальной мощности системы, используемой для воспроизведения.
Во времена войн за громкость пиковое значение аудиоматериала было строго ограничено. Тогда основным носителем был компакт-диск, с которого цифровой аудиосигнал передавался с амплитудным диапазоном в 16 бит. Был определенный пиковый уровень, который цифровая музыка теоретически не могла преодолеть: когда эти 16 бит были заполнены единицами. Когда пиковый уровень был установлен, и возможности его преодолеть найдено не было, у инженеров появился стимул повышать среднеквадратичное значение настолько, насколько это было возможно.
В 2010 году Европейский вещательный союз выпустил EBU R 128, рекомендацию для системы нормализации громкости. Это определило способ измерения воспринимаемой громкости аудиосигнала и, что особенно важно, целевой уровень этого сигнала. Если музыкальное произведение имеет среднюю громкость выше этого уровня, оно должно быть приглушено; если ниже этого уровня, его следует сделать громче.
Новой системой, заменяющей уровень RMS, на данный момент является система единиц громкости (LU). Значение полностью заполненной шкалы (LUFS) измеряет абсолютную громкость и определяется как 0 дБFS. EBU рекомендует для потоковой передачи музыки стремиться к целевому уровню -23 LUFS. Потоковые платформы в какой-то степени с этим справились: Spotify и YouTube нормализовали до -14 LUFS, Apple Music до -16 LUFS, а Amazon нормализовали до -9 и -13 LUFS.
До появления стандарта R 128 десятилетия сжатия музыкального динамического диапазона в конечном итоге оставили нас тяжелый след в истории музыкальной индустрии. В базе данных онлайн-сервиса Dynamic Range Database достаточно результатов, чтобы наглядно проиллюстрировать масштабы сложившегося положения. Этот ресурс позволяет искать исполнителей и альбомы — или просто проверять все альбомы одновременно — и просматривать статистику их динамического диапазона со средними, минимальными и максимальными значениями.
Редко современные альбомы приближаются к 14 дБ динамического диапазона, цифре, которую сайт называет идеальным значением и использует в качестве эталона, выделяемого зелёной рамкой. Но достаточно пролистать список пластинок любого популярного исполнителя, чтобы увидеть целое красное море. Сайт измеряет мастер-записи любого альбома на виниле, цифрового дистрибутива и релиза на компакт-диске отдельно, что позволяет легко заметить, что виниловые релизы часто, хотя и не всегда, предлагают больший максимальный динамический диапазон, чем их аналоги на компакт-диске и цифровой вариант.
На сайте есть один любопытный способ ранжирования выборки. Можно структурировать релизы исполнителя по времени и соотнести со значением их среднеквадратической громкости. Можно взять какую-нибудь долгоиграющую старую группу, например, The Rolling Stones, и проследить, как со временем динамический диапазон их релизов плавно сужается. Причём материал с наивысшим уровнем доброкачественности сигнала, как правило, будет припадать на эпоху издания их записей на виниловых носителях.
Несмотря на отказ от использования пикового уровня сигнала в качестве основы и конечной точки, новые стандарты громкости не игнорируют эту концепцию. True Peak — это новый способ измерения самых громких точек в аудиосигнале путем воссоздания фактического поведения реального непрерывного аудиосигнала. Ян Керр из MeterPlugs проясняет ситуацию:
«Типичный измеритель пикового уровня просто смотрит на дискретные образцы, чтобы определить уровень пика. Проблема заключается в том, что выборки могли быть взяты не синхронно с тем моментом, когда непрерывный сигнал был на пике, поэтому в этих случаях измеритель пиков выборки будет сообщать о более низком пиковом уровне, чем фактическое значение.
Это может привести к дальнейшим проблемам, когда решения по обработке основаны на этом «неправильном» пиковом уровне. Например, предположим, мастеринг-инженер применяет к треку сжатие и ограничение, стремясь к пиковому уровню семпла -1 дБ.
Значение уровень громкости сигнала может быть установлено, но то, в течение какого промежутка времени ведётся непосредственный анализ, может иметь огромное значение.
Вполне возможно, что фактический непрерывный пиковый уровень в этом случае превысит 0 дБ! Когда дорожка в конечном итоге преобразуется обратно в непрерывный сигнал для прослушивания (цифро-аналоговым преобразователем), это может привести к искажениям и артефактам при воспроизведении дорожки.
Измерители True Peak призваны смягчить эту проблему путем обнаружения пиков между выборками: пиков, которые возникают между отдельными выборками. Они делают это, повышая дискретизацию цифрового сигнала, например, с 48 кГц до 192 кГц. Это снижает вероятность пропуска «истинного» пика или, по крайней мере, уменьшает степень его пропуска.
В результате измерения True Peak более точно отражают фактические уровни пиков, чем измерение пиков выборки».
Итак, если LUFS и True Peak берут на себя инициативу, когда дело доходит до измерения громкости, и несут ответственность за то, на какой громкости потоковые сервисы воспроизводят треки, то как можно объяснить тот факт, что музыка меняется по громкости на протяжении отдельных дорожек?
Это измеримо при помощи LRA, числа диапазона громкости, которое описывает интегрированную разницу в LU на протяжении всей дорожки. Допустим, музыкальное произведение начинается с каких-то окружающих звуков и фонового шума, имеет легкое вступление на акустической гитаре и в конечном итоге достигает важной кульминации, прежде чем снова вернуть все обратно — LRA для этого трека будет относительно высоким. С другой стороны, современная техно-мелодия без особых вариаций может оставаться достаточно стабильной по всей своей длине, что тогда даст более низкое значение LRA.
Похоже, что потоковые сервисы в настоящее время не используют значение LRA при калибровке загружаемых треков, поэтому даже если относительно небольшая часть аудиосигнала становится особенно громкой, вся дорожка будет компенсирована на основе этой одной части. Даже самые тихие части будут понижены в громкости.
Таким образом, EBU R 128, возможно, установил устойчивый мир после продолжительных войн за громкость, но одним непреднамеренным последствием является то, что данный стандарт стимулирует снижение значения LRA на протяжении любого трека, и поэтому целые музыкальные произведения могут в конечном итоге иметь меньше изменений громкости на секцию.
Далее будет рассмотрен пример работы над подготовкой трека к публикации на стриминговых сервисах на примере плагина Levels от производителя Mastering the mix.
Шаг 1: Давайте применим некоторые из полученных знаний на практике. На экране плагин Levels от Mastering The Mix, который позволит узнать, в какой степени звук соответствует различным коммерческим и теоретическим стандартам. Плагин навешен на мастер-шину, после обработки дорожек всей цепочкой эффектов.
Шаг 2: При первом воспроизведении, по значкам вокруг круга, можно наблюдать, как ведёт себя звуковой сигнал в разное время, и есть ли какие-то проблемы. Детектор пиков показывает, что пиковое значение микса составляет хороший, безопасный уровень -1 дБ… но так ли это?
Шаг 3: Переключившись в режим True Peak, становится видно, что сигнал действительно достигает пикового значения -0,6 True Peak, а потом плавно снижается до тех пор, пока он не достигнет желаемого значения -1,0. Это знание можно использовать, чтобы уменьшить уровень транзиентов, оставив нетронутыми другие элементы, определяющие среднюю громкость.
Шаг 4: Теперь перейдем к другой важной части: измерителю LUFS. Чтение небольшой части трека (около 3-секундного окна) даёт значение на счётчике между -15 и -13 LUFS. Этот уровень на самом деле идеален, и он позволит треку пройти через любые потоковые проверки совершенно невредимым.
Шаг 5: Постоянный показатель для измерения LUFS уровней на протяжении всей дорожки поможет получить правильное представление о необходимой работе над уровнями, особенно если от начала до конца трек сильно различается по громкости.
Шаг 6: Показатель значения LRA трека говорит о разнице в громкости между его самой громкой и самой тихой частями. Это то, о чем следует помнить, зная, что самая громкая часть, вероятно, будет той, по которой потоковый сервис откалибрует громкость всего трека, а более тихие части могут оказаться слишком тихими.
Шаг 7: Динамический диапазон может показаться не таким важным, сейчас, когда мы находимся в мире LUFS, но должны применяться те же рекомендации, что и всегда: если слишком сильно сжать сигнал, независимо от измеряемой громкости, транзиенты будут терять ясность.
Шаг 8: Хотя последние два индикатора плагина не обязательно имеют какое-либо отношение к измеренной громкости, они все же могут помочь на этом этапе. Стереополе измеряет ширину и фазовую когерентность и позволяет применять фильтры низких и высоких частот к монофоническим верхам или низам трека.
Шаг 9: Bass Space, между тем, дает некоторое представление о том, оставляют ли более высокие элементы трека достаточно места для бочки и баса.
Предлагая простой способ оценки, достигает ли ваш микс или мастер различных коммерческих целей или нет, Levels размещает несколько индикаторов вокруг своего центрального дисплея и окрашивает каждый значок в зеленый или красный цвет, в зависимости от того, как идут дела. Если уровень сигнала не проходит проверку в какой-либо области, можно получить дополнительную информацию о причинах в центральной области плагина.
CJ John PM, 10.02.2022
CJCity.ru