^ Вверх
Статьи / Теория и практика

Реставрация (ремастеринг) фонограмм. Часть 2

Продолжение статьи "Реставрация фонограмм с аудиоленты. Часть 1. Выбор аппаратуры и подготовка кассет". Во второй части мы поговорим о звуковых редакторах, о процессе записи и то, ради чего всё затевалось - о восстановлении фонограмм.

Звуковые редакторы

На сегодняшний день существует много звуковых редакторов, как именитых фирм, так и малоизвестных. Есть ли между ними отличия? Скорее да. Программы первых отличаются более качественными алгоритмами преобразования звука, большим разнообразием подключаемых модулей - плагинов, выполняющих порой сложные обработки (например, NaturalVerb программы WaveLab), более широкими возможностями редактирования.

К ним следует отнести Sound Forge, Adobe Audition, упомянутый WaveLab, Samplitude, SAWstudio. Из них и следует выбирать. Они поддерживают VST и Direct-плагины, а плагинов у них достаточно много (лично я работаю именно с ними). На мой взгляд, выбирать редактор здесь можно исходя из удобства пользования и интерфейса. Лучше установить несколько, при этом плагины установленного ранее «прописываются» в следующем или при установке с выводом соответствующего запроса, или это можно сделать после установки в соответствующем пункте меню. Обычно я работаю в Adobe Audition и мне доступны все подключаемые модули WaveLab и Sound Forge (рис. 1).

Рис.1. Вызов плагинов Sound Forge в программе Adobe Audition
Рис. 1. Вызов плагинов Sound Forge в программе Adobe Audition.

Запись

Ну что, запись? На мой взгляд, это удобней произвести в программе WaveLab, т. к. здесь имеются превосходные по наглядности анализатор спектра и измеритель уровня сигнала. Открываем окно «REC» (здесь и далее описывается версия 5). В окошке File to create устанавливаем Named file (записывать в конечный файл, а не временной), Auto number – галочку не ставим, в строке со значком папки выбираем папку, куда будем записывать файл, в строке ниже выбираем формат: Wave (волновая форма), PCM (без сжатия), Stereo – даже если запись на кассете моно.

Далее – чуть подробнее. Sample rate (частота сэмплирования или дискретизации) выбирается исходя из производительности компьютера и максимальной частоты, поддерживаемой звуковой картой. Выбирается между 44,1 и 192 кГц, чем выше, тем лучше. Bit resolution – битовое разрешение, разрядность, выбирается также, исходя из вышесказанного, и от количества свободного места на жестком диске, которое вы готовы отдать под записываемые файлы, в интервале от 16 до 32 bit. Последние два параметра непосредственно влияют на качество получаемого файла, чем их значение выше, тем качественнее файл, но в тоже время сильно загружают процессор. Применительно к разрядности. С каждой операцией обработки запись «загрязняется» посторонними шумами - артефактами (появляется шорох, скрежет, звон, лязг и др.) из-за т. н. операций округления. 16 бит – это минимум, при котором запись получается качественной, ниже уже нельзя. Обрабатывать такую запись не рекомендуется. Вот ее бы (разрядность) выбрать побольше, но тут следующая заковыка: большинство выпускаемых на сегодня звуковых карт имеют параметры АЦП 24 бита/192кГц. Но внутри себя при соответствующих настройках большинство программ имеют возможность обрабатывать данные и на 32 битах. Поэтому старайтесь работать на максимальных поддерживаемых параметрах используемой программы. Следует отметить вот ещё что. Всегда при переходе от большей разрядности к меньшей в результате обработки происходит искажение фонограммы, но «умная» программа маскирует искажения специальным шумом, причем добавление шума – это тоже искажения, но менее заметные. Кстати, некоторые плагины поддерживают только 24 бита, поэтому всегда перед началом работы изучите документацию программ и вашей звуковой карты по этим вопросам и старайтесь выстроить цепь: вход звуковой карты->используемые программы->конечный файл так, чтобы не было лишних преобразований в плане уменьшения разрядности.

Так вот, выбираем нужные значения и жмем ОК. В окошечке Input (вход) выбираем Audio card input (вход с аудио карты). В колонке, начинающейся с Auto-start… убираем все галочки, здесь указана автоматизация начала и конца записи по паузам и др. Мы все выполняем вручную. Внизу ставим галочку напротив слова Monitor, т. е. в окне записи осуществляется вывод анализа звучащей песни. Форма анализа – Level (уровень). Для оперативного регулирования уровня предназначена кнопка Mixer (микшер). Нажимаем её и справа появляется микшер WaveLab. Подаем сигнал с магнитофона, но ещё не пишем! Устанавливаем ползунки примерно посередине и микшером Вашей звуковой карты (или встроенным микшером WINDOWS, который находится на панели быстрого запуска, если карты не имеется) выставляем уровень так, чтобы не загоралась красная шкала перегрузки и максимальный уровень приходился на -1…-3 дБ, микшером WaveLab выполняем тонкую регулировку. Поканальная регулировка выполняется при нажатой клавише Ctrl. Некоторые авторы говорят, что кратковременная перегруза допустима, но учтите, что ошибки при работе накапливаются, появление искажений неизбежно! Для большей наглядности из главного меню вызываем Analysis –Level\ Pan Meter (измеритель уровня/ панорамы) и Spectrum Meter (спектроанализатор). Чтобы они работали, должна быть отжата кнопочка с рисунком микрофона, находящаяся под командами меню (Audio card input), правее кнопки «Запись». Записываемую фонограмму вначале прослушиваем, желательно до конца. Выявляем все пики, производим коррекцию уровня, обращаем внимание на участки фонограммы с характерными искажениями, производим слуховой анализ. И наконец – REC! Записываем всю фонограмму вместе с паузами, содержащими шум, относящийся к данной записи от начала и до конца.
Если на ленте содержатся несколько записей:
а. выполненных на разных магнитофонах;
б. от разных источников;
в. с отличающимися уровнями, то записываем их по отдельности в разные файлы и в дальнейшем обрабатываем по отдельности!

Adobe Audition не имеет своего внутреннего микшера, поэтому подстройку уровня производим микшером звуковой карты. В меню Options ставим галочки напротив соответствующих пунктов просмотра уровня сигнала. Затем, как и в предыдущем случае, вначале прослушиваем, выставляем уровень и только потом записываем.

Здесь окно записи гораздо проще: в меню File->New, указываем нужные параметры бит/кГц, нажимаем кнопку REC на панели управления, снимаем, если выскакивают, ограничения на время записи и жмем ОК.

Восстановление

Итак, мы получили записанный файл. Теперь мы должны четко представлять себе, что мы хотим получить в конечном итоге. Дальнейшую обработку разделим условно на три этапа. На первом очистим запись только от неприятных щелчков и всё. Если нам нужно сохранить все нюансы оригинала, т. е. «дух того времени» со всеми шумами, шорохами, скрипами, ощущением пространственности и т. п. - то на этом и закончим.

Второй этап - очистка от всех шумов, выделение именно самой звуковой дорожки. Сюда включим операции по коррекции динамического и частотного диапазона.

На третьем этапе произведём улучшение звучания фонограммы: разделение моно на стерео или расширение стереобазы, добавление высоких частот, добавление прозрачности, насыщенности, воздушности и т. п. – добавление составляющих, изначально не содержащихся в исходном музыкальном материале.

Этап первый

Корректировка смещения DC

Итак, первая операция после оцифровки – устранение смещение по постоянному току.

Всегда при записи с аналоговых источников и в некоторых случаях при программной обработке файла появляется т. н. смещение по постоянному току. Форма волны при этом сдвинута относительно нулевой оси в ту или иную сторону. При обработке некоторыми эффектами такой волны появляются искажения. Также при операциях вырезания, копирования, вставке и т. п. в месте соединения частей появится неровность и как следствие – щелчок. Обычно процент сдвига составляет 1-2% в пределах всей записи и незаметен визуально, но уже и этого достаточно для появления заметных на слух искажений при последующих обработках. Вот для примера небольшой фрагмент волны с сильным смещением, которое появилось в начале записи, рис. 2-1:

Рис.2-1. Смещение по постоянному току в начале записи
Рис. 2-1. Смещение по постоянному току в начале записи.

Программа высчитывает значение постоянного смещения для всего файла, затем корректирует его. В нашем случае начальный участок желательно вырезать, чтобы не ввести программу в заблуждение нестандартно большим сдвигом, после этого откорректировать его.

Смещение по постоянному току устраняется в WAVELAB: пункт меню Process->Eliminate DC Offset; в AdobeAudition: Effects->Amplitude->Normalize->DC Bias Adjust.

Устранение кликов

Вторая операция после оцифровки – это удаление различного рода щелчков, импульсных помех, которые в иностранной литературе именуются «Click».

Обычно в начале записи на волновой форме присутствует такой вот бросок напряжения (рис 2-2):

Импульс при начале записи фонограммы на ленту
А

Импульс при начале записи фонограммы на ленту
Б

Рис. 2-2. Импульс при начале записи фонограммы на ленту.

Это всего лишь два разных примера, но уже здесь можно найти характерную особенность, а именно участок почти резкого вертикального спада кривой (стрелка 1), затем крутого нарастания с пересечением через ноль (стрелка 2), это происходит коммутация цепей магнитофона и пологого спуска к нулевой линии (стрелка 3) - момент приближения воспроизводящей головки к ленте, наведения в ней ЭДС и начало движения ленты. Конец записи имеет тоже характерную особенность – вертикальная ограничивающая линия, рис. 3.(красная стрелка). Причем на рис. 3 Б далее следуют импульс, появляющийся в месте склейки ленты с ракордом (обычно красной или белой ленты в конце катушки и кассеты, служащая для заправки ленты в бобину), отмечено синей стрелкой.

Импульс в конце записи фонограммы на ленту
А

Импульс в конце записи фонограммы на ленту
Б

Рис. 3. Импульс в конце записи фонограммы на ленту.

А так выглядит момент включения воспроизведения магнитофона – две резких вертикальных линии, рис. 4. Если присмотреться к рис. 2 Б то в самом начале тоже можно заметить две линии (отмечены желтым на обоих рисунках). То есть, сначала была включена кнопка «REC» в звуковом редакторе, затем кнопка «Воспроизведение» на магнитофоне.

Рис.4. Включение магнитофона
Рис. 4. Включение магнитофона.

Если же включение и отключение производить клавишей «Пауза», то таких пиков не будет.

Искажения такого рода просто вырезаем. Сейчас настало время представить файл целиком, рис. 5.

Рис.5. Общий вид записанной фонограммы
Рис. 5. Общий вид записанной фонограммы.

Мы видим резкие выбросы на 32 секунде, на 2’11”, на 2’19” и далее другие. Рассмотрим первые из них. При увеличении видим следующее, рис 6, 7:

Рис.6. Выбросы на 32
Рис. 6. Выбросы на 32”

Рис.7. Выбросы на 2-11
Рис. 7. Выбросы на 2’11”

Обычно их легко найти при увеличении. Они резко выделяются из общей картины своей нестандартной формой, имеют всплеск амплитуды, их «зубчики» несимметричны относительно нулевой оси и в большинстве своем расположены по одну сторону от оси. Ну и естественно, при воспроизведении прослушиваются как помехи: резкий щелчок или треск.

В большинстве звуковых редакторов звуковой файл можно представить и в виде сонограммы. Здесь по горизонтальной оси откладывается время, по вертикальной частота, цветовой формой представлена амплитуда. Вся прелесть её в том, что она показывает одновременно и частоту и амплитуду. Т. к. помеха – это звуковой фрагмент с широким динамическим диапазоном (от минус бесконечности и до уровня, соизмеримого с уровнем полезного сигнала) и широким частотным диапазоном, т. е. попросту это кусок «белого» шума, то на сонограмме он резко выделяется именно по этим признакам: резкий вертикальный, ярко окрашенный столбик, рис. 8 и 9:

Рис.8. Сонограмма записи на 32
Рис. 8. Сонограмма записи на 32”

Рис.9. Сонограмма записи на 2-11
Рис. 9. Сонограмма записи на 2’11”

Теперь вы имеете представление о том, как выглядят помехи в разных представлениях звукового файла и сможете сами найти все остальные. Сначала ищем выделяющиеся всплески на общей картине, затем, постепенно увеличивая масштаб, просматриваем заново. Потом переводим вид в сонограмму и просматриваем ее. Все помехи вырезаем. Занятие очень нудное, но через какое-то время набирается опыт: вы будете уже знать, где искать и как искать и дело пойдет быстрее.

В программе WAVELAB имеется удобная функция для поиска кликов (щелчков) «Audio error detection and correction». В ней имеется три режима поиска, использующих разные алгоритмы. Так вот, в этой композиции она нашла, с настройками по умолчанию, соответственно, 38, 36 и 30 ошибок (error). Причем, если в первом и втором случаях клики расположены примерно по всей области файла, то в последнем сосредоточены в одном месте, рис 10, 11., отмечены красными маркерами:

Рис.10. Результат использования режима Click Detection 1
Рис. 10. Результат использования режима Click Detection 1.

Рис.11. Результат использования режима Digital Click Detection
Рис. 11. Результат использования режима Digital Click Detection.

Красными кружками выделены клики, которые программа «не увидела», а нам бы так этого хотелось! Это те пресловутые клики на 29”, 2'11” и все последующие, видные невооруженным глазом, т. е. без увеличения масштаба. Стоит ли пользоваться такой функцией – решать вам. Скажу вот еще что. Около 70% всех найденных ей кликов ну никак не выделяются на слух. Оно и понятно, потому что эти 70% ошибок находятся на совершенно ровном месте в прямом смысле этого слова волновой формы. Каждую ошибку программа помечает маркером, исправлять их можно как в ручном режиме, переходя от маркера к маркеру, так и автоматически. Если изменить настройки, то число найденных ошибок может увеличиться лавинообразно. Стоит ли терять на это время, решать вам.

Сказанное также относится и к функциям Auto Click/Pop Eliminator и просто Click/Pop Eliminator в AdobeAudition, призванных также бороться со щелчками. Обе не «заметили» щелчков на 2’ 11” , 2’ 19” и других, четко определяемых на слух.

Как я уже сказал, такие помехи вырезаем. Согласно психоакустике восприятия, человеческое ухо не обнаруживает искажения в звуке длительностью до 5 мсек., т. е. в музыкальном фрагменте оно не обнаружит щелчок, а в щелчке – музыкальный фрагмент, поэтому такая операция для помех схожей длительности незаметна. Если же помеха гораздо длиньше или вам нежелательно изменять время звучания композиции вырезанием такого фрагмента, например, если она привязана к видеоряду или другой композиции, то импульс просто нормализуем. Уровень нормализации удобней выставить в децибелах по соседним значениям отсчетов.

Клиппирование

Проще говоря, клиппирование – это превышение сигналом допустимого для данной разрядности динамического диапазона. Появляется в процессе оцифровки обычно при повышенном уровне записи и далее при преобразованиях амплитуды. При этом сигнал, превысивший максимум, просто обрезается. Если посмотреть на обрезанный сигнал, рис. 12 а и б, то на волновой форме, например, под линией «0 дБ» будет ровная горизонтальная площадочка, т. е. пик с отрезанной макушкой. Клиппирование – источник сильных, режущих слух, искажений.

Рис.12. Клиппирование сигнала
Рис. 12. Клиппирование сигнала.

Число клиппированных отсчетов можно узнать в AdobeAudition, вызвав в пункте меню Analyze функцию Amplitude Statistics, рис. 12. Amplitude Statistics – один из самых мощнейших и полезных инструментов. Более тесно с ним мы познакомимся в следующих разделах, а здесь и сейчас нас интересует вкладка General и пункт Possibly Clipped Samples – количество клиппированных отсчетов. В нашем файле их 197 в левом и 111 в правом каналах, рис. 13.

Рис.13. Окно Amplitude Statistics
Рис. 13. Окно Amplitude Statistics.

Довольно-таки много, учитывая, как мы тщательно выставляли уровень записи. Из пункта Effects меню открываем раздел Restoration и вызываем функцию Clip Restoration, рис. 14. Настройки следующие: Input Attenuation (усиление входа) – 0 дБ; Overhead (уровень клиппированных отсчетов в % от уровня амплитуды) - 97,72%. или 0,2 дБ, (рис. 14). Примем его по уровню нашей будущей нормализации (см. следующий раздел). Minimum Run Size — минимальное число отсчетов, превысивших значение Overhead, при котором эти отсчеты принимаются за клиппированные, (рис 12). Выставляем 1. Имеются три предустановки: легкое клиппирование, нормальное и значительное. Выбираем одну из них и нажимаем ОК. Качество восстановления контролируем параметром Possibly Clipped Samples.

Рис.14. Окно Clip Restoration
Рис. 14. Окно Clip Restoration

Здесь хочется отметить вот что. Клиппирование также может присутствовать и на пленке (и оно часто присутствует) в результате превышения уровня сигнала ещё при записи на магнитофон. Но свойства магнитной ленты таковы, что оно не так заметно на слух. Естественно, что если при оцифровке мы четко контролировали уровень записи, программа не «увидит» клиппирования на пленке и не «узнает» его.

При малом числе клиппированных отсчетов его можно и не проводить.

В нашем примере после вырезания всех щелчков их вообще не осталось!

Нормализация

Нормализация – это процесс обычно увеличения (иногда уменьшения) амплитуды (громкости) сигнала до определенного уровня по определенному значению - в простейшем случае, устанавливаемый звукорежиссером как норма, причем всегда без искажения сигнала, т. е. переполнения разрядной сетки. В программах нормализация может быть произведена по пиковым уровням или по среднеквадратичному значению сигнала RMS. В чем разница? Если у вас имеются две записи: на одной, скажем, флейта, на другой барабаны, записанные с одинаковой RMS, то после нормализации по пиковым уровням, например до 0 дБ, RMS да и субъективная громкость первой будут выше. Здесь программа из-за изначально большего динамического размаха пиков барабанов усилит вторую запись незначительно и разность усиления будет равна половине разности их динамических диапазонов. Это следует учитывать, например, при записи разных по характеру звучания треков на один диск. С этим сталкиваются и при простой записи на диск. С одной стороны, чтобы сделать трек громче, нужно усилить его побольше, при этом обрезаются пики; с другой, чтобы сохранить весь динамический диапазон, громкость его следует понизить.

Стандарт нормализации компакт-дисков -0,2дБ или в процентах 97,72%, но считается приемлемым и 99% и 100% (0 дБ). WAVELAB и AdobeAudition производят нормализацию по пиковым уровням по командам соответственно: Process->Normalize и Effects->Amplitude->Normalize. Здесь имеется пункт Normalize L|R Equally (нормализовать левый и правый каналы одинаково). Если в квадратике стоит галочка, то левый и правый каналы нормализуются вместе по одному максимальному уровню, иначе для каждого канала максимальный уровень вычисляется отдельно и нормализация для каждого канала также происходит отдельно по этим значениям. Раздельная нормализация применяется, если амплитуды каналов существенно разнятся, более чем на 2 дБ, в результате, скажем, разного уровня записи на магнитную ленту или дефекта самого магнитофона и др.

Если было произведено устранение клиппирования (вспомните параметр Overhead) то нормализация не делается.

Ну вот, мы прошли первый этап обработки, о котором говорилось в самом начале. Если вы стремились именно к этому результату, то на этом можно и закончить. Мы никак не изменили фонограмму, а лишь слегка «подретушировали» мелкие недостатки. Хотите большего – идем дальше!

Этап второй

Анализ

Вначале проведем анализ. Все последующие операции будем проводить в программе AdobeAudition. Взглянем на наш файл целиком, рис. 5. Сразу скажу, что это за запись. Это запись живого концерта Виктора Цоя, который был показан по первому каналу году примерно в 2000-ном, точно не помню. Она была выполнена на обычную «бюджетную» кассетную магнитолу SONY без каких-либо технических «наворотов», путем непосредственного подключения к звуковому моновыходу телевизора. Кассета самая обычная, лента BASF, судя по упаковке. Песня «Звезда по имени Солнце». Концерт проходил в закрытом помещении, пели и играли, как я уже говорил, вживую; микрофоны на сцене фонили каждую минуту, зрители орали и визжали, слышны их отдельные выкрики; в перерывах между песнями можно разобрать фразы переговаривающихся музыкантов. Т. е. запись представляет собой интерес и её стоит восстанавливать. Я не пытался найти этот концерт в Интернете или в продаже на дисках, вполне допускаю, что он где-нибудь есть уже отреставрированный или даже оригинальный в «чистом виде». Естественно, звук на кассету записывался без пауз; на компьютер тоже в один прием для сохранения атмосферы происходящего. Для наглядности и простоты примера я вырезал одну из песен целиком с небольшим участком паузы в конце.

Над нашим материалом мы уже произвели три действия:
1. Устранили смещение по постоянному току;
2. Вырезали импульсные помехи (с побочным результатом – устранением клиппирования);
3. Нормализовали звуковую волну.

Теперь сделаю небольшое отступление:
Все люди, разбирающиеся в звуковой технике, радиолюбители, знают, что чем короче тракт, по которому проходит звуковой сигнал, тем он (сигнал) меньше искажается. Здесь критично все: и число радиоэлементов и длина соединительных проводов. Это же правило сохраняется и в компьютерной обработке: чем меньше операций, тем лучше. Поэтому надо стремиться к их меньшему числу.

Так вот, анализ. В AdobeAudition имеется прекрасная функция анализа динамического диапазона. Вызвав в пункте меню Analyze функцию Amplitude Statistics на вкладке General смотрим, рис. 15: Peak Amplitude (амплитуда максимального пика) - (-0,21) и (-0,18); Possibly Clipped Samples – клиппированных отсчетов нет; DC Offset – равен нулю; Total RMS Power (среднеквадратичный уровень сигнала, а попросту интересующая нас средняя громкость) – (-14,65 дБ) и (-15,66 дБ). Внизу в маленьком окошечке Actual Bit Depth указана действительная разрядность звуковых данных, то бишь реальная разрядность, с которой была произведена оцифровка. Minimum RMS Power – минимальный среднеквадратичный уровень сигнала, Maximum RMS Power - максимальный среднеквадратичный уровень сигнала. Все остальные отсчеты расположены между ними со средним уровнем громкости Total RMS Power. Далее открываем вкладку Histogram, рис 16. По горизонтальной оси откладывается значения уровня в дБ, по вертикальной – процентное наполнение волновой формы, соответствующее данному уровню. Как я уже говорил, гистограмма – это мощный инструмент в арсенале AdobeAudition.

Рис.15. Вкладка General
Рис. 15. Вкладка General.

Рис.16. Вкладка Histogram
Рис. 16. Вкладка Histogram.

Теперь проделаем следующее: объединим вместе гистограмму и волновую форму, рис 17.

Рис.17. Совмещенные гистограмма и волновая форма
Рис. 17. Совмещенные гистограмма и волновая форма.

Мы видим, что основное распределение отсчетов находится в интервале от -8 до -25 дБ. В районе -8 дБ и правее сосредоточены пики нашей волновой формы. От -25 дБ и левее – обычно шумы, которые на волновой форме отдельно представлены в начале файла.

Сделаю ещё одно небольшое отступление:
Что мы знаем о шуме в общих чертах? У каждого звука есть два параметра: частота и амплитуда. Обычно шум на фонограммах по динамическому диапазону расположен на 15-30 дБ ниже, чем основной музыкальный материал и имеет частотный диапазон от 2кГц и до предела слышимости, т. е. в области высоких частот. Конечно и из этого есть исключения.

Гистограмма оказывает неоценимую помощь при проведении динамической обработки. Итак, делаем предварительный вывод:
1. Средний уровень громкости составляет примерно 15 дБ, что все-таки маловато. Обычно у «магазинных» компакт-дисков этот параметр находится в пределе -12…-7 дБ Одно из возможных действий – жесткое лимитирование на уровне 8 дБ с последующим усилением сигнала на 8 дБ.
2. Полезный динамический диапазон -8-(-25)=17 дБ некоторым может показаться недостаточным – концерт то «живой»! Поэтому можно, не выполняя действия п. 1, применить жесткое лимитирование до -8 дБ, затем экспандирование в 1,5 – 2 раза с учетом того, что средняя громкость должна оставаться на нормальном уровне. Но это действие вступает в противоречие вот с чем. В начале главы я сказал, что на данной записи в перерывах между песнями слышны голоса музыкантов и зрителей, которые представляют особую ценность и ради этого все и затевалось! Естественно, их уровень низок и при применении экспандера еще более понизиться. Поэтому попробуем.
3. Применив лимитирование до -8 дБ, расширить диапазон в область этого «освободившегося» участка. Таким образом, увеличиться и средняя громкость и динамический диапазон.

Конечно, это все только предварительные выводы. После применения того или иного инструмента для обработки любые из вышеперечисленных параметров, а то и все сразу, могут измениться и они изменяются.

Частотный спектр оценивается на панели Frequency Analysis, вызываемой из меню Analyze, рис. 18. Лучше всего установить следующие настройки: вид графика – логарифмический, FFT Size - 256 … 1024. В данном случае за большими значениями гнаться не стоит: увеличивается время обновления спектра и пропадает наглядность. Установив курсор на горизонтальную или вертикальную шкалу и дождавшись, когда он превратится в «лапу», можно перетаскиванием мышкой изменить видимое в окне расположение спектра, а прокручивая колесико мышки - масштаб спектра.

Рис.18. Панель анализатора спектра AdobeAudition
Рис. 18. Панель анализатора спектра AdobeAudition.

Установив курсор на любую точку окна, под графиком сразу же получаем текущие координаты курсора в Гц и дБ. Нажав на кнопку Scan (Сканирование выборки) получаем анализ всей волновой формы или выделенного участка.

Для оценки мгновенного спектра в более наглядным и удобным считаю панель Spectrum Meter программы WaveLab (рис 19), но это дело вкуса.

Рис.19. Панель анализатора спектра WaveLab
Рис. 19. Панель анализатора спектра WaveLab.

А теперь совместим гистограмму рис. 16 и анализатор спектра рис. 18 и проанализируем их вместе, рис 60. Например, можно узнать частотные составляющие того или иного участка динамического диапазона. Итак, мы предположили, что область ниже -25 дБ – это шумы. Взглянув на анализатор спектра, видим: начиная примерно с 3300 Гц график в общем случае имеет плавный спад до конца. Ниже линии в -25 дБ имеются только высокие частоты, что подтверждает, что это составляющие шума.

Рис.20. Совмещенные гистограмма и анализатора спектра
Рис. 20. Совмещенные гистограмма и анализатора спектра.

Удаление шума

Начинается самое интересное! Вы все уже умеете работать с функцией Noise Reduction в AdobeAudition, рис. 21. Захватываем шум, программа его анализирует, выбираем весь файл, ставим на предпрослушивание, если результат нас удовлетворил – запускаем выполнение. Подскажу настройки данного окна для получения наилучшего качества. Значение FFT Size – 24000 - максимальное; Reduce by – 40 дБ; Precision Factor – 10; Smoothing Amount – 1; Transition Width – 0; Spectral Decay Rate – 0.

Ползунком Noise Reduction Level выставляем уровень удаления шума. Рекомендуемый от 60% и до 90%. Дело в том, что при превышении значения в 60% в фонограмме начинаются проявляться посторонние призвуки – артефакты, появляется своеобразное «металлическое» звучание. Но опять же не всегда и не для всех фонограмм. Поэтому лучший советчик тут – уши. Обязательно прослушайте файл при нажатой кнопке Keep Only Noise («оставить только шум») на предмет наличия в удаляемом материале музыкальных фрагментов. Для нашего файла мы поступим так.

Рис.21. Окно Noise Reduction
Рис. 21. Окно Noise Reduction

Кстати, под графиком Noise Profile (профиль шума) находится еще один график, рис 31. С его помощью можно удалить уровень шума только на определенном частотном диапазоне. Т. к. шумы сосредоточены в высокочастотной области, то поэкспериментировав, можно найти его оптимальную форму именно для высокочастотной области спектра. При этом существенно уменьшается время обработки и снижаются искажения. Вы должны быть точно уверены, что шум в вашей записи имеется только в определенном диапазоне частот. Выделяем образец шума, запускаем анализ. Выставляем линию необходимым образом, контролируем предпрослушиванием, нажимаем ОК. Теперь, чтобы точно убедиться, что шум полностью удален, в основном окне зацикливаем выделенный образец и прослушиваем его. Если нет шипения (остался шум на высоких частотах), потрескивания (остался шум на низких частотах), а слышен только шум того аппарата, через который вы слушаете звук, а на волновой форме - гладкая линия, значит удаление прошло успешно. К сожалению, этот метод мало применим к магнитофонным записям, т. к. шипение и треск присутствуют там на всем частотном диапазоне.

После этих операций удаляем образовавшуюся тишину в начале файла (там, где мы захватывали профиль шума) чтобы уменьшить длину и, соответственно, объем файла и не тратить ресурсы компьютера на бесполезную обработку этого участка. (Но я этого не сделаю, чтобы сохранить расположение файла на временнОй координатной сетке для дальнейших пояснений.) Все вышесказанное можно без труда проделать, если шум присутствует в файле в явном виде, где-нибудь в начале или в конце. А если локализовать шум трудно?

Если вы нашли хотя бы небольшой кусочек шума для образца, а программа выдает, что для анализа его слишком мало, то поступаем следующим образом: выделяем его и копируем несколько раз подряд в начало или в конец песни, затем общий шум отправляем на анализ.

Третий способ извлечения шума. В AdobeAudition, вызываем пункт меню Analyze, далее Amplitude Statistics и вкладку Histogram, рис. 22. Если внимательно всмотреться в гистограмму, то с левого от нее края можно увидеть растянувшуюся на десяток-другой децибел «зубчики пилы» - обычно это и есть шум.

Рис.22. Гистограмма фрагмента в котором шум не присутствует в явном виде
Рис. 22. Гистограмма фрагмента в котором шум не присутствует в явном виде.

В нашем случае «пила» простирается от 25 до 50дБ. Это и есть шум. (Для этого примера я не стал специально выискивать запись, а просто обрезал «видимый» шум у нашего файла на волновой форме). Для того, чтобы использовать этот шум в дальнейшем, нужно его отделить. Это выполняется с помощью динамической обработки. В целях сохранности исходного материала при дальнейших операциях делаем промежуточное сохранение и еще раз открываем файл в новом окне. В пункте меню Effects выбираем Amplitude и открываем окно Dynamics Processing. На вкладке Graphic устанавливаем график на подавление участка от 25 до 0 дБ, рис. 23:

Рис.23. Подавление участка от 25 до 0 дБ
Рис. 23. Подавление участка от 25 до 0 дБ.

Полученный результат мы используем как образец шума, но сначала прослушиваем его: действительно ли это только шум и ничего больше? Если это так, то захватываем его и сохраняем в предустановках программы шумоудаления. Возвращаемся в предыдущее окно к исходному файлу, снова вызываем Noise Reduction, находим в предустановках наш шум и запускаем на выполнение. Предупреждаю сразу: результат будет далек от ожиданий, и оценка, которую вы ему поставите, скорее всего будет «уд.» и «неуд.». Чтобы получить приемлемое качество шумоудаления придется повозиться с настройками Attack (атака) и Release (спад) на соответствующей вкладке, рис. 23. Все параметры Gain (усиление) устанавливаем на 0. Далее придется на слух подобрать форму нижнего графика в окне Noise Reduction. Он может выглядеть примерно вот так, рис 24, с преобладанием подавления в высокочастотном спектре, иначе «металлическое» звучание неизбежно. Вы наверно заметили, что желтая полоса поднялась выше красной – происходит удаление и музыкального материала, но только чисто теоретически! Дело в том, что в нашем примере при анализе частотного спектра (рис. 20) выяснилось, что частотный диапазон записи не превышает 4,0-4,5 кГц, а самая первая точка изгиба линии начинается с 5170 Гц, это видно в окошечке под графиками (скриншот специально делался под эту точку). Вот и все.

Конечно, если и этот способ не применим, есть еще несколько, при которых образец шума выделяется по иным, косвенным, признакам или даже искусственно генерируется по какому-либо подобию. Например, шум можно попытаться выделить из пауз внутри самой песни между словами, когда играет всего один инструмент путем фильтрации лишних звуков.

Но хочу дать общий совет: собирайте, накапливайте, коллекционируйте шум! Он вам может здорово пригодиться при очистке однотипных лент со схожими условиями записи.

Рис.24. Фрагмент графиков окна Noise Reduction
Рис. 24. Фрагмент графиков окна Noise Reduction.

Устранение шипения

Если не удалось воспользоваться Noise Reduction или его действие вас не устроило, можно попробовать применить инструмент Hiss Reduction, который дает неплохие результаты в удалении шума, а точнее шипения, но не во всех случаях.

Он вызывается из пункта меню: Effects->Restoration->Hiss Reduction, рис 25.

Рис.25 Окно Hiss Reduction
Рис. 25 Окно Hiss Reduction.

Окно имеет следующие настройки: FFT Size – чем выше, тем лучше; Precision Factor –20; Transition Width –рекомендовано от 5 до 10; Spectral Decay Rate – рекомендовано от 40 до 75%. Reduce Hiss by –понизить шипение на … - параметр прибавляет установленное значение к параметру Noise Floor. Ползунком Noise Floor Adjust устанавливаем необходимую степень шумоудаления. Пресеты: High Hiss Reduction, Light Hiss Reduction, Standart Hiss Reduction - соответственно, сильное, легкое и стандартное понижение шипения. Кнопкой Get Noise Floor идентифицируется шипение с числом заданных точек Drag Points.

На предмет удаления полезной составляющей фонограммы проведите прослушивание при выбранном значении Keep Only Hiss – сохранить только шипение. Можно настроить форму кривой на графике, создавая узлы и перетаскивая их мышкой.

Этот инструмент также как и Noise Reduction привносит «металлическое» звучание, поэтому и здесь необходимо искать оптимум.

Подрезка границ частотного диапазона

Реальные границы частотного диапазона, записываемого и воспроизводимого с компакт-кассеты равна 10-20 Гц … 12,5–14 кГц. Выше и ниже частоты тоже записываются, но они уже тонут в шумах и выделить из них какой-либо музыкальный материал достаточно сложно. Чтобы вообще избавиться от них, рекомендуется подрезать как низ, так и верх, скажем: до 40Гц и выше 14 кГц. Сделать это можно, например с помощью функции FFT Filter.

Для тех же, кто занимается ремастерингом профессионально записанных фонограмм, сообщаю: верхняя граница частотного диапазона для ленты простирается: при скорости 2.38 см/с – до 13 кГц, при скорости 9.53 см/с – до 25 кГц, при скорости 19.05 см/с – до 50 кГц (данные взяты из книги Петров А. А. Звуковая схемотехника для радиолюбителей / Под ред. С. М. Янковского. - СПб.: Наука и Техника, 2003).

Динамическая обработка

Обычно после удаления всех шумов проводится динамическая обработка. Как мы уже говорили выше, динамический диапазон нашего материала довольно узок, что связано с передачей исходного сигнала по TV. Посмотрим, что можно сделать. Вызываем функцию Amplitude Statistics и снова анализируем.

Рис.26. Гистограмма записи после удаления шумов
Рис. 26. Гистограмма записи после удаления шумов.

Гистограмма расположилась в промежутке приблизительно от 31 до 8 дБ. Средняя громкость составляет 14,65 и 15,77 дБ в левом и правом каналах соответственно. На основе этих данных проделаем вот что: лимитируем сигнал на уровне 8 дБ, а точнее – «подсмотрим» параметр Maximum RMS Power на предыдущей вкладке - 7,97 дБ по уровню наиболее громкого канала. Одновременно расширим сигнал от 30 дБ на 7 дБ с запасом для клиппирования при дальнейших операциях.

Для лимитирования записи вызываем окно Hard Limiter, рис 27.

Рис.27. Окно инструмента Hard Limiter
Рис. 27. Окно инструмента Hard Limiter.

Для динамической обработки вызываем окно Dynamics Processing, рис 28.

Рис.28. Окно инструмента Dynamics Processing
Рис. 28. Окно инструмента Dynamics Processing.

Итак, для выбранных нами действий на графике создаем две дополнительные точки: точка 1 с координатами -30; -30 – начало экспандирования в окрестности значения Minimum RMS Power; точка 2 с координатами -7; 0 – конец диапазона экспандирования и усиление на 7 дБ.

Ниже приведены рисунки с последовательным изменением волновой формы нашей записи в результате всех вышеперечисленных действий, рис. 29, а, б, в:

Изменение волновой формы при динамической обработке
а. перед динамической обработкой.

Изменение волновой формы при динамической обработке
б. после обработки лимитером.

Изменение волновой формы при динамической обработке
в. после экспандирования.

Рис. 29. Изменение волновой формы при динамической обработке.

Теперь параметр Total RMS Power составляет 10,03 дБ 11,23 дБ для левого и правого каналов, что очень неплохо. Динамический диапазон - около 24 дБ. Обязательно проверьте, не появилось ли клиппирование.

Если вы довольны результатом – идем дальше.

Частотная обработка

Частотная обработка, впрочем как и динамическая, не является обязательной. При отсутствии на то предпосылок она не проводится. В нашем случае при слуховом контроле выяснилось следующее:
1. Во время концерта регулярно «фонят» микрофоны, что проявляется неприятным и громким свистом вблизи частоты 5 кГц.
2. Отмечается недостаток низких частот.
3. Отмечается недостаток высоких частот, начиная с 2,5 кГц.

В общем случае звучание можно охарактеризовать следующим образом: голос исполнителя – вполне естественное, натуральное, четкое; мелодия - тусклое, глухое, расплывчатое.

Для уменьшения призвука от фонящих микрофонов находим на волновой форме нужный участок, выделяем его, замечаем на анализаторе спектра «выстреливающие» частоты и с помощью графического эквалайзера подавляем их до приемлемой амплитуды. Проделываем это со всеми фрагментами.

Для поднятия низких и высоких частот посредством того же эквалайзера приподнимаем соответствующие ползунки. Но не стоит злоупотреблять: повышаем их не более чем на 6 дБ, иначе возрастут неслышимые до этого уровни помех. Также не следует усиливать те частоты, которых на спектроанализаторе вообще нет по той же причине. Следующий подводный камень здесь – появление клиппирования в результате чрезмерного усиления сигнала. Поэтому в случае чего для всей фонограммы необходимо предварительно понизить уровень громкости.

И последний шаг – нормализация. Если предполагается третий этап, то нормализацию не выполняем. Волновая форма у нас достаточно красива, рис. 29, в!

Вот и подошел к концу второй этап. Наш музыкальный материал «очищен», подкорректирован, имеет вполне приемлемое звучание, которое гораздо качественнее оригинала на ленте. Осталось совсем немного – приукрасить и придать ему «товарный вид».

Этап третий

Для превращения моно в стерео существуют десятки инструментов, причем как в самих звуковых редакторах, так и в виде всевозможных плагинов. Не даю никаких советов – пользуйтесь на здоровье! Мера разделения каналов определяется прослушиванием. В нашем примере, если вы заметили – запись «как будто бы» стерео: на это указывают различия в каналах на рис. 5,13,15,16 и др. Но я говорил, что записывание производилось с моновыхода телевизора. Эти различия имеют амплитудный характер, но не временнОй, и проблема здесь, скорее всего, в неидентичности каналов самого магнитофона. Этот недостаток можно было устранить в самом начале, нормализовав или дополнительно усилив тихий канал, т. е. выровняв их амплитуды. Но для последующего разделения это, возможно, плюс.

Улучшить звучание фонограмм также призвано много функций и плагинов. Их применение весьма спорно, поэтому они и получили меткое, саркастическое название «улучшайзеры», Никаких объективных показателей их работы нет, контроль результата производиться на слух. И вот здесь, на мой взгляд, все действия лучше выполнять в программе WaveLab, т. к. она имеет незаменимую вещь – панель Master Section, производящую обработку в режиме реального времени с функциями Mute (приглушение выбранного эффекта) и Solo (приоритета выбранного эффекта), потому что при применении сразу нескольких эффектов некоторые из них могут оказаться «лишними», частично дублировать друг друга, или ухудшать общее звучание. Итак, рекомендую обратить внимание на следующие инструменты:
Auto Panner – создает эффект перемещения источника звука между каналами. При высокой частоте перемещения создается эффект «стерео»;
Stereoecho - стереоэхо, говорит сам за себя;
StereoExpander – расширение стереопанорамы;
Externalizer – по действию похож на предыдущий и на все «расширители» стерео, эффект напоминает изменение расстояния между колонками;
Multiband Compressor – одновременно производит динамическую обработку в нескольких частотных диапазонах, на практике используется обычно для добавления недостающих низких и высоких частот;
Natural Verb – имитирует акустические свойства помещений, от обычной комнаты до концертных залов;
Spectralizer – добавляет высокие частоты,
и многие другие.

Здесь важно не переусердствовать, пытаясь использовать все сразу, потому что, как я уже говорил, некоторые функции в них сходны, например: Natural Verb и Stereoecho, а также различные ревербераторы; Multiband Compressor и Spectralizer; StereoExpander и Externalizer. Поэтому загружаем эти эффекты в ячейки и кнопками Mute и Solo прослушиваем их и вместе и по отдельности и в различной комбинации до получения желаемого эффекта без искажений. Кстати, искажения могут возникнуть при применении любого из них, так что не отрывайте глаз от окна Master панели Master Section с измерителем пикового уровня. Здесь имеется в виду только клиппирование при применении различных операций усиления.

А теперь вернемся к нашему примеру.

Для начала с помощью Multiband Compressor были добавлены низкие и высокие частоты.

Затем проведено разделение моно на стерео инструментом StereoExpander. Почему именно такая последовательность? Дело в том, что как я уже говорил, в композиции практически отсутствуют музыкальные составляющие выше 2,5 кГц, а т. к. стереоэффект четко локализуется лишь на средних и высоких частотах, чтобы точнее отследить результат работы StereoExpander, вначале и были добавлены высокие частоты.

Далее был добавлен эффект звучания «в концертном зале» с помощью Natural Verb.

И последний этап – нормализация.

Всё! Выводим и сохраняем наш файл.

Здесь я намеренно не приводил параметры настроек для вышеперечисленных инструментов. Оптимума здесь нет. В конце второго этапа была получена «чистая» фонограмма, а на третьем этапе мы ее только «украшали»; а как это сделать лучше – дело вкуса.

Вместо заключения или несколько советов напоследок

На этом закончилась вторая часть статьи. Надеюсь, каждый смог почерпнуть из нее что-то полезное для себя. Кому-то она показалась неинтересной. Конечно, за один раз невозможно описать всю теорию, все приемы работы, привести все примеры. Сразу хочу сделать оговорку: приведенные в статье методы и пути реставрации не являются единственными возможными, в том числе и для описанного примера. Скажем, AdobeAudition не является единственным программным средством: для реставрации в WaveLab v5 существуют функции: DeNoiser и DeClicker; в SoundForge v8 - Noise Reduction, правда, последний поставляется отдельно в виде плагина.

И еще несколько слов. После каждого действия над фонограммой обязательно анализируйте произошедшие изменения с помощью описанных выше анализаторов, чтобы понимать и «видеть», что произошло с ней, что конкретно изменилось: громкость, динамика, пики, провалы и т. п.

Но помните одно: в звуке главным критерием качества являются субъективные оценки звучания, и никакие объективные параметры не могут быть окончательными и обязательны для выполнения действий (например, см. комментарии к рис. 10, 11), они лишь призваны помочь, наметить путь, указать нужное направление. Поэтому всегда слушайте и прослушивайте свой материал после каждого выполненного шага.

Мустафин А.М., 09.04.2008
CJCity.ru

Комментарии (12)

Чтобы оставить комментарий, .

  • nikto
    nikto 09.06.2015 11:46 #

    Это огромный труд по ликвидации безграмотности. Но вот когда человек заканчивает ВУЗ, и если у этого человека наступает сознание того, что то, чему он учился 5 лет ему не нужно, то значит он получил высшее образование. По крайней мере так было в СССР. Также и здесь. Надо пройти всю эту науку только для того, чтобы на личном опыте изучив влияние всех этих компрессоров, эксайтеров, денойсеров и прочих искажателей, понять, что для серьезных студийных музыкальных работ это вредоносно для звука. Ну, а говоря о реставрациии редких старинных записей, то скорее для бытовых записей это будет более актуально в криминалистике, если, например, в руки полиции попадется какая-нибудь неразборчивая бытовая запись.

  • semen
    semen 03.02.2015 21:41 #

    ...да нет, не фикция...благодаря этой статье у меня много чего полезного получилось...да и редакторы стали по большому счёту сговорчивыми...а ещё, уважаемый D.J. Truba, разницу между реставрацией и созданием с нуля улавливайте...эти два понятия даже пишутся по разному...

  • Гость
    (Гость) 05.06.2013 20:01 #

    D.J. Truba - Все это фикция,невозможно угробленный в шумах и щелчках звук (в которых часть полезной информации остается уже безвозвратно утерянной),сделать первоклассным или близким к этому,потому что вся эта обработка улучшает звук в не больших пределах,и при правильном ее использовании,и людьми имеющих профессиональный опыт работы со звуком.

  • Гость
    (Гость) 07.09.2011 20:45 #

    Владимир - Хорошая информация для начинающего.

  • Гость
    (Гость) 13.08.2011 22:18 #

    sibirjak1610 - 30% дельных советов, 70% - инструкция: как угробить аналоговый звук!

  • Гость
    (Гость) 19.02.2011 22:16 #

    Автор статьи - К сожалению, бываю здесь редко. Со всеми вопросами - через почту (подпись под статьей активна!)

  • Гость
    (Гость) 23.11.2010 23:26 #

    Давид - нужна ваша помощь нужно очистить от шума и скрипа диктофонную запись

    caraiman.david@yandex.ru

  • Гость
    (Гость) 23.01.2010 16:42 #

    js - напишите третью часть в которой реставрируйте ещё одну запись и дайте совет как быть если у меня магнитофон воспроизводит ТОЛИКО до 6khz

  • Гость
    (Гость) 08.07.2009 01:38 #

    Эдуард - А я не парюсь, если мне попадеться при записи с винила треск или щелчек в участке трека, найду похожий кусок в треке без изъян, поставлю маркеры,выделю его,скопирую, и замещю участок с изъяном на этот. Wavelab рулит.

  • Гость
    (Гость) 25.06.2009 16:44 #

    Автор статьи - Так какая ещё инструкция необходима? Это же и так написано для начинающих. Если конкретно с ВИНИЛА, то процесс реставрации абсолютно идентичен. Оцифровка может и имеет какие-либо свои тонкости при работе с винилом, но, на мой взгляд, эти отличия кроются только в аппаратной составляющей, т. е. работа с проигрывателями.

  • Гость
    (Гость) 16.05.2009 08:41 #

    Eliass -

    Статья достойная похвалы. Согласен, что это мега-работа. Также согласен, что непростое это дело - оцифровка и доведение до ума полученного материала. Думаю, что необходима еще одна инструкция/мануал для "чайников", так сказать - краткий курс, чтоб не отпугивать желающего заниматься винилом уже с первых строк наставления.

  • Гость
    (Гость) 27.03.2009 09:36 #

    chega93 - как всё сложно :P

    я без проблем кассеты и винил слушаю с пребольшим удовольствием, чем без щелчков и так далее.

    но за статью нельзя не сказать спасибо просто мега-работа!

Пополнения софта для Windows

  • Ignite Amps PTEq-X v1.1.0
    Ignite Amps PTEq-X v1.1.014 декабря 2017

    Бесплатный плагин, эмулирующий ламповый эквалайзер. Он состоит из 3-х пассивных эквалайзеров, сэмулированных при помощи фильтров и "ламповых" алгоритмов обработки.Плагин разработан

  • Stone Voices Ambient Reverb v4.0
    Stone Voices Ambient Reverb v4.012 декабря 2017

    Бесплатный ревербератор, предназначенный прежде всего для работы со звуками в жанре эмбиент, хотя с успехом может быть применён и в других музыкальных стилях и направлениях.

  • TBProAudio Isol8
    TBProAudio Isol812 декабря 2017

    Усовершенствованный инструмент мониторинга микширования. Он делит диапазон частот на 5 диапазонов. Эти 5 полос могут быть включены, как соло или индивидуально отключены. Это

  • Digital Brain Instruments vPlayer 2
    Digital Brain Instruments vPlayer 212 декабря 2017

    vPlayer 2 - это автономное программное обеспечение, разработанное для быстрого тестирования новых инструментов vst / au без использования каких-либо DAW. Но также может быть

  • Full Bucket Music FB-3200
    Full Bucket Music FB-320010 декабря 2017

    Программный инструмент, имитирующий Polyphonic Synthesizer Korg PS-3200, выпущенного в 1978 году. Он написан на языке C ++ для высокой производительности и низкого потребления

Новости музыкального софта

Новости музыкального оборудования