Реставрация фонограмм с помощью программы DART Pro
Архивные записи, хранящиеся на магнитофонных лентах и виниловых пластинках, со временем теряют первоначальное качество звучания. На них появляются различные шумы и помехи, мешающие нормальному прослушиванию и портящие общее впечатление от записи. Наиболее часто встречающиеся дефекты - это импульсные помехи (щелчки) и фоновые шумы (шипение магнитофонной ленты, шум при воспроизведении с винилового диска), вызываемые плохими условиями хранения или недостаточно хорошим качеством первоначальной записи материала.
С возрастанием мощности современных компьютеров и появлением более сложных алгоритмов обработки звуковых сигналов появилась возможность восстанавливать архивные фонограммы путем сложной вычислительной обработки исходного сигнала при помощи компьютера. Такой способ восстановления звука обладает чрезвычайно высокими эффективностью и гибкостью, позволяет устранять помехи, щелчки, фоновый шум и другие дефекты записи, практически не оказывая никакого отрицательного влияния на основной сигнал.
Средства удаления шумов с фонограмм уже начинают внедряться в профессиональные редакторы звука (например, в виде дополнительных программных модулей для Sound Forge и WaveLab - см. статью "Конкретная музыка", "Мир ПК" # 6/97). Разработаны также программы, предназначенные специально для восстановления аудиозаписей. Одной из таких программ является DART Pro, выпускаемая фирмой Tracer Technologies, которая содержит полный набор средств, позволяющих качественно удалить с записи импульсные помехи и фоновые шумы. Кроме того, с ее помощью пользователь в дальнейшем сможет совершенствовать восстановленную фонограмму. Таким образом, DART Pro позволяет достичь отличных результатов при реставрации любых фонограмм.
При открытии аудиофайла в основном окне возникает амплитудная картина звуковой волны, масштаб которой по горизонтали можно изменить, нажав в пределах окна на правую кнопку мыши и выбрав требуемое значение. Масштаб отображения файла по вертикали задается значением параметра в окне Multiplier, находящимся на линейке инструментов. В правой верхней части основного окна звуковой волны размещается маленькое Info-окно, в котором содержатся информация о текущем положении курсора (t), значение амплитуды волны в этом месте (S(t), для стереофайлов L(t) и R(t)), размер файла в байтах (FS) и координаты выбранного участка файла (BS/BE).
Над основным окном расположена узкая двойная полоса просмотра, на которой желтой вертикальной чертой отображается текущее положение курсора, вертикальными зеленой и красной - положение маркеров (отметок). Для отображения рамки используется синий цвет, положение отображаемой на экране области волны отмечается голубым цветом, выбранный на звуковой волне участок - серым. Поместив курсор на полосу просмотра и нажав на левую кнопку мыши, можно переместить курсор воспроизведения в выбранную точку. При этом изменится также отображаемая на экране область файла. Участки файла можно выбирать, помещая курсор на полосу просмотра и передвигая его в нужном направлении при нажатой правой кнопке мыши.
Под главным меню расположена линейка инструментов, содержащая кнопки быстрого доступа к наиболее часто используемым командам.
С помощью DART Pro можно не только использовать в своей работе уже существующие звуковые файлы, но и производить оцифровывание звука с любого внешнего источника. Для записи файла достаточно выполнить команду Record-Record, нажав на клавишу R на клавиатуре или кнопку записи на панели инструментов. Выбрав имя и параметры записываемого файла (частоту дискретизации, разрядность, моно/стерео) в появляющихся меню, можно записывать сигнал. После окончания записи система спросит: желаете ли вы зарегистрировать файл? При регистрации на диске создается дополнительный файл с расширением .sfm, описывающий структуру файлового дерева, в которой зарегистрированный файл является корневым (root). Создавать подобные деревья очень удобно при работе над отдельным файлом. В этом случае различные варианты обработки корневого файла будут ветвями и подветвями дерева.
При обработке основного файла и его производных дерево автоматически обновляется, и его в любой момент можно просмотреть, вызвав командой File-Open Soundtree. Отметка слева от имени файла означает, что в настоящий момент он открыт. В этом же окне можно вызывать прослушивание файлов, нажав на кнопку воспроизведения, удалять их или просматривать текстовые комментарии.
Программа DART Pro, наряду с восстановлением и реставрацией фонограмм, предоставляет широкие возможности для редактирования и монтажа звуковых файлов. Выбор участка звукового файла можно осуществить, либо перемещая мышь вдоль него при нажатой клавише <Ctrl>, либо поместив курсор воспроизведения в начало избранного фрагмента и щелкнув мышью в его конце при нажатой клавише <Shift>. Чтобы выбирать участки так же, как в большинстве звуковых редакторов, не нажимая на <Ctrl>, нужно убрать отметку в поле Options-Setup-Use ctrl to select blocks. Выбранный участок, при выделении окрашивающийся в серый цвет, можно расширять или сужать при помощи мыши.
DART Pro позволяет помещать на картине звукового файла маркеры двух видов. Маркеры зеленого цвета удобно использовать для быстрого перемещения к интересующим точкам на редактируемом файле. Для постановки маркера нужно поместить курсор в требуемое место файла и выполнить команду Edit-Set-Remove markers. В появляющемся меню необходимо выбрать порядковый номер маркера из восьми возможных и нажать на Set. После этого в заданном месте появится зеленая вертикальная линия с порядковым номером. Для удаления маркера нужно нажать на Remove в появляющемся меню.
Маркеры красного цвета служат для выделения щелчков (click markers). На месте постановки такого маркера в случае наличия отрицательного звукового сэмпла к нему добавляется положительный импульс, а в случае положительного - отрицательный. Маркерыдобавляютсякомандой Edit-Set-Remove click markers. Для того чтобы отметить отдельный участок файла, используется команда Edit-Set-Remove frame. При этом вокруг выделенного участка возникает рамка голубого цвета, что позволяет в любой момент найти искомый участок на картине звуковой волны.
Все маркеры и рамки являются временными, действуют только в пределах одной сессии и не сохраняются в обрабатываемом файле.
Большая часть операций редактирования производится не над самим исходным файлом. При многих операциях на экране автоматически открывается окно с картиной второго файла, полученного в результате обработки исходного. В окне исходного файла имеется буква S на красном фоне (Source), в окне результирующего - буква D на синем (Destination).
Все основные операции редактирования осуществляются из меню Edit; с помощью команд Cut, Copy, Paste можно не только редактировать один файл, но и осуществлять обмен данными между несколькими открытыми файлами. При редактировании рекомендуется выключать опцию синхронизации файлов S и D, включенную по умолчанию, для того чтобы изменялся только один из файлов. Снятие синхронизации осуществляется командой Window-Synchronization-None.
Можно вставлять содержимое из буфера обмена тремя способами: Paste insert (вставкой содержимого буфера, начиная с текущей позиции курсора), Paste over (заменой текущего материала содержимым буфера) и Paste fill (заменой выделенного участка файла содержимым буфера).
В меню Toolbox включены различные команды, предназначенные для не слишком сложной обработки звука: Scale - для усиления или ослабления сигнала на выделенном участке в соответствии с заданным коэффициентом усиления; Maximize - для усиления сигнала до максимально возможного уровня без цифровой перегрузки; Mute - для минимизации амплитуды выбранного участка сигнала до нуля; Reverse - для воспроизведения файла или выделенного фрагмента в обратном порядке.
Всегда весьма полезно знать, насколько далеко вы зашли в обработке файла и напоминает ли он хотя бы в некоторой степени исходный материал. Для сравнения двух открытых файлов S и D используется команда Compare. Результирующий файл, называемый result.wav, получается вычитанием второго файла из первого и содержит все результаты сравнения, причем его длина всегда равна длине самого короткого из сравниваемых файлов.
DART Pro позволяет смешивать содержимое исходного и результирующего файлов, задавая коэффициент смешивания, причем перед этим фазу второго файла можно инвертировать.
Достаточно интересна возможность разделения стереофайла на два монофайла с помощью команды Split, а для обратной операции - объединения двух монофайлов в один стерео - используется команда Unite.
Для изменения тембра сигнала в широких пределах DART Pro предлагает такие мощные средства, как эквалайзер и пять различных типов фильтров. Девятиполосный графический эквалайзер, вызываемый командой Toolbox-Equalize, обеспечивает десять предустановок и позволяет в течение нескольких секунд предварительно прослушать обработанный сигнал до полного просчета всего файла.
Частотные фильтры находятся в меню Toolbox-Filter. Фильтр LowPass служит для удаления из фонограммы высокочастотных составляющих, лежащих выше задаваемого в поле Cutoff Frequency частотного порога; фильтр HighPass понижает уровень низких частот, лежащих ниже уровня Cutoff Frequency; фильтр BandStop вырезает из спектра сигнала среднечастотную составляющую, ширина которой задается в полях Lower Cutoff Frequency и Higher Cutoff Frequency, а степень понижения уровня частот определяется значением в поле Stopband Attenuation. Для удаления из сигнала высокочастотной и низкочастотной составляющих применяется фильтр BandPass, а фильтр Notch используется в тех случаях, когда из исходного сигнала необходимо удалить компоненты, лежащие в очень узком частотном диапазоне, хотя регулировки этого фильтра отличаются недостаточной точностью. Подобный фильтр целесообразно использовать для устранения фонового шума, вызываемого переменным напряжением: для этого достаточно лишь задать центральную частоту фильтрации равной 50 Гц.
Команды Fade In и Fade Out соответственно позволяют плавно увеличивать или ослаблять громкость звуковой волны в пределах выбранного участка по линейному или логарифмическому закону. Пользуясь функцией Crossfade, можно смешать два файла таким образом, что громкость первого будет постепенно затухать, а громкость второго - нарастать. Такой прием обычно используется для объединения двух файлов в один, Crossfade при этом применяется лишь в конце первого файла и в начале второго.
Особое внимание следует уделить спектральному анализу фонограмм, который DART Pro осуществляет в режиме реального времени. Такой анализ дает возможность определять распределение мощности сигнала по частотам, что позволяет получить много интересных сведений. Например, по форме спектрального графика человеческой речи хороший специалист может определить, какой звук был произнесен в какой-либо момент времени. Для активизации режима спектрального анализа следует выполнить команду Toolbox-Spectrum или воспользоваться соответствующей кнопкой на панели инструментов. В появившемся окне можно увидеть спектральный график сигнала как в линейном, так и в логарифмическом масштабе.
В том же окне выбираются метод спектрального анализа: FFT (быстрое преобразование Фурье) или AR (авторегрессионный), а также количество сэмплов в блоке, который подвергается анализу (Frame). Если выделить мышью участок файла, вызвать функцию спектрального анализа, снять отметку Auto и нажать кнопку Update, то на экране можно получить усредненный спектр всего выделенного участка.
Основные инструменты DART Pro, предназначенные непосредственно для удаления шумов и восстановления фонограмм, расположены в меню Restore. Так, функции DeHiss и DeNoise предназначены для удаления помех и шумов различных типов, а функция DeClick - для удаления импульсных помех (щелчков) и фонового шума низкой интенсивности.
Базируясь на показаниях специального программного детектора, DART Pro определяет наличие импульсных помех в сигнале и проводит реконструкцию записанного материала в месте помехи, причем одновременно можно удалить и фоновый шум. При выборе команды DeClick появляется специальное меню, в котором регулируются настройки инструмента с помощью трех основных параметров: Smoothing factor, Postfiltering factor, Detection threshold.
Smoothing factor (фактор сглаживания) определяет коэффициент сглаживания фильтра Калмана, применяемого на первой стадии удаления шума. Коэффициент может иметь значение от 0,0 до 2,0, хотя рекомендуемое значение колеблется в пределах 0,0-0,1. В любом случае оптимальное значение нужно подбирать по слуху, добиваясь качественного удаления помех без заметного влияния на основной сигнал. Postfiltering factor (фактор фильтрации) задает коэффициент фильтра, предназначенного для удаления фоновых шумов и шумов, возникающих после прохождения сигнала через фильтр Калмана. Этот коэффициент может изменяться в пределах 0-2 при рекомендуемом значении менее 0,5. Данный фильтр работает с большей степенью фильтрации в паузах и с меньшей - на громких участках фонограммы, когда шум менее заметен. Такой способ обработки позволяет сохранить качественный и чистый сигнал и добиться хорошего уровня подавления шумов. Detection threshold (порог чувствительности) определяет степень чувствительности детектора импульсных помех; его значения могут лежать в пределах 3-10 при рекомендуемом 3,5.
В меню настроек DeClick также следует отметить тип обрабатываемого материала - Music (музыка) или Speech and music (голос и музыка), а также область обработки - Processing range: All (весь файл) или Window (выделенный участок).
После обработки на экране монитора появляются два дополнительных окна: файл с отметкой D (Destination) и Binary с расширением .det. В первом окне находится файл, прошедший обработку, а во втором в виде прямых вертикальных линий отображаются дефекты, обнаруженные программным детектором в процессе обработки исходного файла.
В левой части окна бинарного файла расположены две пустые прямоугольные рамки для выбора канала для редактирования, в правой части окна - зеленые прямоугольные рамки, в которых отображается уровень сигнала в месте нахождения курсора. Файл, выведенный детектором, можно легко редактировать с помощью команд Edit-Set bits mode (нанесение дополнительных групп бит), Edit-Clear bits mode (уничтожение групп бит). Для нанесения или уничтожения групп бит используются команды Set bits in selected block, Clear bits in selected block, Toggle bits in selected block.
Удаление импульсных помех можно проводить и в ручном режиме. Для этого необходимо выполнить команду Restore-Duplicate, чтобы создать результирующий файл, вместе с которым создается и пустой бинарный .det-файл, который можно редактировать вручную. Кроме того, можно редактировать и бинарный файл, созданный в процессе автоматической обработки файла командой DeClick. После этого выполняется команда Restore-ReTouch, в результате чего появляется меню настроек инструмента ReTouch, в котором следует задать коэффициенты сглаживания и фильтрации, а также область обработки. При нажатии кнопки Process происходит обработка файла и появляется диалоговое окно, позволяющее сравнить звучание исходного файла, целевого файла после обработки DeClick и файла, прошедшего обработку ReTouch.
Руководствуясь результатами прослушивания, можно принять получившийся результат или провести повторные редактирование и обработку файла функцией ReTouch.
Для удаления фоновых шумов DART Pro предлагает два специализированных алгоритма: DeNoise и DeHiss. DeNoise использует распечатку шума, получаемую из обрабатываемого файла, а DeHiss содержит стандартизированные, заранее просчитанные модели шумов. Применение DeHiss часто оказывается очень эффективным даже после обработки фонограммы при помощи DeNoise. Особенно хорошо DeHiss справляется с шумами, изменяющимися по интенсивности на протяжении всей фонограммы.
Для использования алгоритма DeHiss достаточно открыть требуемый файл, выбрать на нем отдельный участок, подлежащий обработке, и выполнить команду Restore- DeHiss. В появившемся меню нужно настроить пять параметров, определяющих работу алгоритма восстановления фонограммы. Коэффициент Gain является самым важным параметром настройки алгоритма DeHiss, который определяет количество шума, удаляемого из аудиосигнала. Его значение можно как выбирать из пяти стандартных настроек, так и подстроить вручную с высокой степенью точности. Коэффициент измеряется в логарифмических единицах, поэтому даже незначительное его колебание может привести к заметным изменениям в звучании фонограммы. Параметр Smoothing range определяет степень спектрального сглаживания сигнала, которое необходимо для устранения искажений звуковой волны, возникающих при обработке с помощью алгоритма шумоподавления. Команда Frame size задает размер частично перекрывающихся анализируемых блоков, на которые сигнал разбивается в процессе обработки. Более короткие блоки выбираются при высоких отношениях сигнал/шум и при обработке речи, более длинные - при низких отношениях сигнал/шум и при обработке записей инструментальных музыкальных произведений. Overlay определяет степень перекрытия анализируемых блоков. При выборе более коротких областей перекрытия увеличивается скорость обработки сигнала, хотя для качественной очистки сигнала от шума нужно выбирать длинные области. Степень фильтрации высоких частот задается коэффициентом Frequency carving.
Алгоритм DeNoise не использует готовых моделей шумовых процессов, поэтому перед обработкой каждого файла нужно провести анализ имеющегося в нем шума. Для этого следует выделить участок фонограммы, на котором присутствует только фоновый шум без основного сигнала, и выполнить команду Restore-NoisePrint, получив, таким образом, распечатку шума.
Результат анализа можно сохранить в списке предустановок для использования в дальнейшем. DeNoise вызывается командой Restore-DeNoise. Нужная распечатка шума появляется в поле NoisePrint, по умолчанию DeNoise использует последнюю проведенную распечатку. При необходимости можно провести дополнительную настройку параметров алгоритма шумоподавления, которые аналогичны имеющимся в алгоритме DeHiss, за исключением того, что параметр Gain заменяется параметром Weight, выполняющим аналогичную ему функцию.
До полной обработки звукового файла DART Pro позволяет предварительно прослушать получающийся результат. Для этого нужно выбрать один из алгоритмов восстановления в меню Restore-Test и, проведя необходимые настройки параметров и задав время предварительного прослушивания в секундах, нажать на Play result. Таким образом, за короткое время можно вручную подобрать необходимые значения параметров.
С помощью имеющихся в меню Restore средств восстановления фонограмм можно удалить шумы любого типа и привести к надлежащему виду практически любой файл. Если не удается добиться хороших результатов при автоматическом режиме работы программы, то можно подстраивать регулировочные параметры вручную, находя оптимальные настройки для каждой конкретной фонограммы и для каждого типа шумов и помех. Во многих случаях хорошие результаты дает многократная обработка файла каким-либо из алгоритмов, причем при многократной обработке DeClick рекомендуется отключать факторы сглаживания и фильтрации. Эффективно также применение алгоритма DeClick к файлам, запущенным в обратном направлении с помощью команды Reverse из меню Toolbox.
Программа DART Pro располагает также мощными средствами управления файлами, находящимися в работе. Если зарегистрировать исходный файл как корневой, то Soundfile Manager позволит отследить все произошедшие с ним изменения.
В комплекте с DART Pro в качестве отдельного приложения поставляется дополнительное средство управления файлами - WaveManager, предназначенное для объединения нескольких отдельных файлов в последовательность, называемую Playlist.
Подобное объединение файлов проводится тогда, когда нужен быстрый и удобный доступ к файлам, относящимся к одной теме, но находящимся в разных местах жесткого диска компьютера. Все файлы, входящие в playlist, остаются на своих местах, а WaveManager создает файл с расширением .wmn, в котором хранятся только ссылки на фонограммы.
В заключение можно отметить, что DART Pro обеспечивает действительно хорошее качество восстановления аудиозаписей и обладает многофункциональным набором алгоритмов обработки, что позволяет при реставрации записей обходиться без дополнительных программ. Несомненным достоинством является возможность восстановления файлов в ручном режиме, что позволяет устранять длинные по времени помехи, плохо удаляемые в автоматическом режиме. Все алгоритмы восстановления могут настраиваться в самых широких пределах, что позволяет для шума каждого типа с высокой точностью подобрать оптимальный способ обработки и, главное, выбрать такие параметры алгоритмов, при которых не произошло бы среза высокочастотных составляющих основного сигнала.
Недостатком программы является плохо продуманная система отмены проведенных операций редактирования (Undo). DART Pro вообще не создает никаких временных служебных файлов, которые позволяли бы отменить совершенное действие. Вся забота об этом переложена на пользователя, которому нужно вручную, когда он сочтет нужным, создавать undo-файл с помощью команды File-Create undo file, причем даже при таком сложном методе сохранения копий файла операция отмены совершенных действий остается одноуровневой, так как при каждом выполнении команды Create undo file новый файл записывается поверх предыдущего. Разработчикам DART Pro стоило бы также подумать и о поддержке частоты дискретизации более высокой, чем 44,1 кГц, так как почти все новые звуковые платы способны оцифровывать звук на частоте, по крайней мере, 48 кГц. Очень полезным было бы и наличие настраиваемой линейки инструментов для быстрого доступа к наиболее часто используемым функциям и инструментам редактирования. Однако мелкие недостатки и недоработки не оказывают существенного влияния на общее положительное впечатление от работы с программой, так как самое главное - это результат на вполне профессиональном уровне.
Антон Павленко, 07.09.2003
root@mpcclub.msk.su
Карайман Давид Кирилович - мне нужно очистить кусочек записи 3-минуты
Полина - Приветя
Анатолий - Здравствуйте, спасибо за информацию. Хотя, по правде говоря, я всё это делаю в Nuendo.
Exabytes - =)
Nick - Привет!
миша - Здраствуйте