^ Вверх
Статьи / Софт

Синтезаторы речи для «продвинутых»

Каждый из нас, наверняка сталкивался тем или иным образом с синтезатором речи. В общем и целом их называют «преобразователями из текста в речь» или, более распространённая аббревиатура – TTS (Text-to-speech). Сейчас любой желающий может зайти в переводчик Google и услышать собственными ушами, как работают подобные системы. Было время когда эту технологию активно внедряли в различные системы перевода. Но нас, как музыкантов, интересует использование синтезаторов речи в качестве вокала, при создании музыки, а также в виде плагина для нашей рабочей станции. И это тоже возможно – рассмотрим несколько подобных VST-инструментов и программ.

Aques Tone 2

Первый плагин – от японских разработчиков, со всеми вытекающими последствиями (рис.1).

Рисунок 1. Интерфейс Aques Tone 2
Рисунок 1. Интерфейс Aques Tone 2.

Неизвестно, заведомо ли японцы решили привнести некоторые ошибки, вроде «Poli» вместо «Poly», но и других японских «фишек» здесь хватает. Например, руководство пользователя доступно только на японском. Но это полбеды. Плагин заточен в основном под японские фонемы! Чтобы понять это на практике представьте, как японец произнёс бы английскую фразу, записанную в японской транскрипции.

Кроме того, органов управления не так уж и много. Основная секция здесь в верхнем окне, в котором загружается файл с нужными фразами. Почему нельзя было сделать возможность писать фразы и проигрывать их «на лету» - непонятно. Ну что ж, попробуем синтезировать какую-нибудь фразу.

Для этого нужно в любом текстовом редакторе написать её, сохранить, а затем загрузить в плагин. Возьмём, к примеру, простую фразу «Hey, yo, come on»! Для того, чтобы Aques Tone 2 распознал её более-менее адекватно, нужно написать так: «hey yo camon». И сохранить файл с расширением txt (в моём случае – hello.txt).

Теперь открываем этот файл, нажав на кнопку Open (рис. 2). Не забываем установить тип файлов «txt».

Рисунок 2. Открываем файл с «лирикой»
Рисунок 2. Открываем файл с «лирикой».

Если всё правильно загрузилось, в нашем основном окне, мы увидим записанную нами фразу – «hey yo camon».

Следующий шаг – прописать партию. Собственно, обозначить моменты, когда будет звучать каждый слог. Схема здесь такая – с нажатием каждой новой ноты проигрывается очередной слог. На рисунке 3 я подписал над каждой нотой за какой слог она отвечает.

Рисунок 3. Прописываем ноты для слогов
Рисунок 3. Прописываем ноты для слогов.

Как видим, располагаются они своим особым образом. К примеру, почему-то звук «N» отделился на отдельную ноту, а не «прилип» к слогу «MO». Да и вообще, если послушать демо-фразы, встроенные в программу, то очевидно прослушивается направленность на японский язык.

Регуляторы, представленные в этом vst-инструменте, не представляют особого интереса. Они отвечают за некоторые характеристики эмулируемого голоса. Самым ощущаемым на слух я выделил бы Gender. Он делает голос либо более «мужским», либо более «женским». Кавычки я поставил не случайно, т.к. однозначно сложно сказать – мужской ли это голос, либо женский. Также, к примеру, регулятор Resonance при очень низких значениях делает голос совершенно неестественным, а при высоких – более мягким. Остальные параметры можно «крутить» на свой вкус. Ну и напоследок хочется отметить, что доступен всего лишь один встроенный голос под именем «Lina». Впрочем, послушайте сами сэмпл из нескольких тактов созданной нами фразы – сделайте выводы. Плагин бесплатный.


Скачать (126 kb)

VirSyn Cantor 2

В отличие от предыдущего представителя, Cantor 2 представляет собой более «продвинутую» систему для синтезирования вокальных партий, но уже за денежку. Он также имеет версию в виде отдельной программы. Хотя и vst-инструмент представляет собой аналог piano-roll в секвенсоре: взгляните на интерфейс (рис. 4).

Рисунок 4. Главное окно VirSyn Cantor
Рисунок 4. Главное окно VirSyn Cantor.

Поскольку этот плагин обладает большим инструментарием, он может манипулировать большим количеством параметров голоса. Но начинать нужно всё равно с построения фразы по слогам. Как несложно догадаться, делается это посредством piano roll. Здесь же есть панель инструментов с привычными «карандашами», «ластиками» и т.п. Собственно, попробуем синтезировать упоминавшуюся выше фразу «hey, yo, come on»! Нарисуем события в виде прямоугольных областей, а также подпишем каждый из них, как на рисунке 5.

Рисунок 5. «Рисуем» фразу в piano-roll в Cantor
Рисунок 5. «Рисуем» фразу в piano-roll в Cantor.

Как можно увидеть, слова написаны над событиями не все целиком. Например, слово «come on» разбито на два слога – «com» и «on». Внимательные пользователи заметят, что внизу автоматически прописаны фонемы – это довольно удобная функция. Если вдаваться в подробности и нюансы, то нужно очень хорошо представлять себе, что такое фонемы и прочие тонкие нюансы звучания речи, доступные разве что узким специалистам. Мы просто оставим это как есть и посмотрим как оно работает в общем. Но это не всё. Теперь в самой миди-партии дорожки Cantor 2 тоже нужно прописать партию, соответственно которой будут звучать наши слова (слоги). Сделаем так, как на рисунке 6.

Рисунок 6. «Рисуем» фразу в piano-roll в секвенсоре
Рисунок 6. «Рисуем» фразу в piano-roll в секвенсоре.

Теперь можно включить проигрывание в секвенсоре и убедиться, что у нас появился некий звук на выходе.

Далее настроим некоторые нюансы звучания. Сразу оговорюсь, что для исследования всех нюансов настройки Cantor 2 нужно писать целую книгу. В рамках этой статьи мы рассмотрим общие параметры. Итак, во-первых, можно выбрать уже готовый голос. Доступно их около десятка. Открыть их можно в верхней части программы, в опции Load voice (рис. 7).

Рисунок 7. Загружаем голос
Рисунок 7. Загружаем голос.

По-умолчанию был установлен «Nikki», но я переставил его на «Luther». Можете попробовать различные голоса, как женские, так и мужские.

Во-вторых, здесь есть секция эффектов (собственно, раздел Effects, рис. 8).

Рисунок 8. Добавляем эффекты
Рисунок 8. Добавляем эффекты.

Доступно 4 эффекта – Distortion, Echodelay, Chorus и Reverb. Хотя эти же эффекты можно добавлять и отдельно.

Про секции Phoneme и Voice нет смысла рассказывать, т.к. они довольно сложны в освоении и разобраться в их настройках может разве что довольно узкий специалист. Хотя никто не мешает покрутить ручки в этих секциях и таким образом изменить звучание. Либо корпеть над теорией синтезирования речи, а также над руководством пользователя Cantor, чтобы понимать как это всё должно работать. В общем, довольно много параметров, довольно сложно и довольно примитивный звук получается в итоге.

Тем не менее, даже новичок, если постарается, сможет получить звучание, наподобие того, что получилось у меня.


Скачать (126 kb)

Fruity Loops Studio

Возможно, многие из вас, увидев Fruity Loops, удивятся, каким образом он попал в эту статью, ведь это скорее, программа для создания музыки, нежели синтезатор речи. Всё дело в том, что Fruity Loops имеет в своём арсенале очень неплохой синтезатор речи. Называется он Speech Synthesizer. И хоть его нет в виде отдельного плагина, но можно вставить сам FL как vst-плагин в вашу рабочую станцию и там уже использовать его Speech Synthesizer. Но я всё же предпочитаю создавать речевую партию в самом FL, затем экспортировать её в аудиофайл, после чего использовать в любой рабочей станции.

Итак, попробуем создать партию из предыдущего примера непосредственно в FL Studio. Вставим этот плагин в наш проект (рис.9).

Рисунок 9. Добавляем Speech Synthesizer в Fruity Loops
Рисунок 9. Добавляем Speech Synthesizer в Fruity Loops.

Как только мы добавим его в проект, автоматически появится окно, предлагающее ввести наш текст. Можно долго не думать и сразу ввести нашу фразу из примеров выше (рис. 10).

Рисунок 10. Настройки параметров речи
Рисунок 10. Настройки параметров речи.

Кроме того, можно сразу же установить и другие параметры речи, такие как голос (доступно около 20 голосов), стиль произношения, режим (шёпотом, с придыханием, либо обычный) и настройки темпа и тональности. Советую сразу настроить темп (у меня он, допустим 140, соответственно темпу проекта). Кнопка Listen позволяет прослушать партию «на лету», до её создания. После того, как мы подобрали нужные параметры нажимаем галочку, программа предложит нам сохранить наш файл с созданной речевой партией и в проекте создаётся новая партия с вокалом (рис. 11).

Рисунок 11. Новая речевая партия в проекте
Рисунок 11. Новая речевая партия в проекте.

Нам не нужно заморачиваться – Speech Synthesizer создал за нас дорожку, которая представляет собой Fruity Slicer с созданной в нём партией, разбитой по нотам, где каждому слову соответствует отдельная нота (на рисунке 11 справа как раз видно, что у нас есть партия с 4 кусочками). Кроме того, в piano roll созданы дорожки для нот с подписанными словами, что очень удобно (рис. 12).

Рисунок 12. Окно piano-roll с новой партией
Рисунок 12. Окно piano-roll с новой партией.

Всё довольно наглядно и просто. Не нужно прописывать фонемы, подбирать слоги, чтобы фраза звучала правильно. Достаточно просто ввести фразу – она будет звучать уже довольно сносно и разборчиво. Затем также просто можно переставлять слова и экспортировать партию в желаемый аудиоформат. Можно убедиться самим, прослушав пример.


Скачать (108 kb)

Что же лучше из рассмотренных синтезаторов речи?

Лично моё мнение: лучше живая речь, живой вокал. Если же выбирать из вышеупомянутых программ, то, безусловно по количеству настроек и параметров выигрывает Cantor 2. Тем более, что он претендует на звание не просто синтезатора речи, а даже вокального синтезатора. Если выбирать по удобству, простоте и качеству звучания, я отдаю предпочтение Speech Synthesizer из Fruity loops.

Дополнение от редакции

Есть ещё бесплатная программа для синтезирования речи - AnalogX SayIt. Можно настроить различные параметры и после предпрослушки сгенерировать результат в звуковой файл.

Farmatique, 25.06.2014
CJCity.ru

Комментарии (0)

Чтобы оставить комментарий, .

Пополнения софта для Windows

  • Stone Voices PolyGAS v2.4
    Stone Voices PolyGAS v2.420 октября 2017

    Виртуальный синтезатор формата VSTi v2.4, основанный на гранулярном методе синтеза звука. Основные возможности: 32-голосая полифония. Поддержка файлов сэмплов в форматах WAV

  • Tritik Krush v1.1.1
    Tritik Krush v1.1.120 октября 2017

    Krush является выразительным, ярким понизителем битности и даже немного больше.Krush сочетает в себе «хрустящий» привкус цифрового звучания с «теплом»

  • Full Bucket Music FB-3300
    Full Bucket Music FB-330016 октября 2017

    Бесплатный VST-плагин, симулирующий полифонический синтезатор 1977 года Korg PS-3300. Закройте эмуляцию поведения и все элементы управления оригинальным оборудованием. Три

  • Thomas Mundt LoudMax v1.19
    Thomas Mundt LoudMax v1.1912 октября 2017

      Лимитер с автоматическим выравниванием уровня громкости.Максимальная громкость регулируется слайдером "Drive". Максимальная громкость звука на выходе - слайдером "Output".

  • TBProAudio mvMeter v1.0.6
    TBProAudio mvMeter v1.0.612 октября 2017

    mvMeter является многофакторным измерителем сигнала, включающий RMS, EBUR128, VU и измерения PPM. Особенности: Поведение классических аналоговых VU и PPM измерителей. Несколько

Новости музыкального софта

  • Эмулятор Roland TR-606 для iOS
    Эмулятор Roland TR-606 для iOS от Elliott Garage 23 октября, 2017

    TR-606 традиционно считается одной из менее известных драм-машин от Roland (по сравнению с 808 и 909). Но на самом деле существует довольно...

  • Propellerhead Reason 10
    Propellerhead анонсируют Reason 10 15 октября, 2017

    Добавив поддержку VST-плагинов в  Reason 9.5 в начале этого года, Propellerhead Software снова сосредоточились на встроенном контенте...

  • Пружинный ревербератор PSP Audioware Nexcellence
    Пружинный ревербератор Nexcellence от PSP Audioware 12 октября, 2017

    PSP Nexcellence - это плагин, имитирующий аппаратные пружинные ревербераторы с висящей пружиной (necklace-type). Он предлагает два разных набора...

  • Многофункциональный ревербератор Rob Papen RP-Verb 2
    Многофункциональный ревербератор RP-Verb 2 от Rob Papen 16 сентября, 2017

    Rob Papen показали как может выглядеть и звучать хороший плагин-ревербератор в 2009 году, выпустив RP-Verb. Теперь они готовы похвастать 2 версией....

  • Плагин Waves Clavinet
    Новый фанковый Clavinet от Waves 12 сентября, 2017

    Waves выпускают ещё одни классические клавишные в виде нового плагина Clavinet. Это сэмплированная эмуляция D6 Clav, очень популярного инструмента...

Новости музыкального оборудования

  • Электроорганы Roland из серии V-Combo
    Roland выпускают 2 электрооргана из серии V-Combo 23 октября, 2017

    Roland объявили о выпуске двух новых органов из серии V-Combo - VR-730 и VR-09-B. Эти клавиатуры разработаны как “рабочие лошадки”,...

  • Native Instruments Komplete Kontrol Mk2
    Native Instruments Komplete Kontrol Mk2 15 октября, 2017

    Большим нововведением в Komplete Kontrol Mk2 стали два цветных экрана высокого разрешения вместе с 17-ю дополнительными функциональными кнопками....

  • Native Instruments Maschine Mk3
    Native Instruments Maschine Mk3 15 октября, 2017

    Компания Native Instruments представила обновление своего оборудования с выпуском новой Maschine и Komplete Kontrol. Оба продукта имеют новый...

  • акустический предусилитель Boss AD-10
    Новый акустический предусилитель AD-10 от Boss 16 сентября, 2017

    Boss анонсировали новую педаль для акустических гитаристов - полнофункциональный AD-10 Acoustic Preamp. AD-10 предлагает технологию акустического...

  • Bluetooth-колонки Fender Newport и Monterey
    Fender выпускают новые Bluetooth-колонки 05 сентября, 2017

    Fender выходит на рынок Bluetooth-акустики с портативными колонками Newport и Monterey. В новых моделях использованы имена Newport и Monterey,...