^ Вверх
Статьи / Софт

Синтезаторы речи для «продвинутых»

Каждый из нас, наверняка сталкивался тем или иным образом с синтезатором речи. В общем и целом их называют «преобразователями из текста в речь» или, более распространённая аббревиатура – TTS (Text-to-speech). Сейчас любой желающий может зайти в переводчик Google и услышать собственными ушами, как работают подобные системы. Было время когда эту технологию активно внедряли в различные системы перевода. Но нас, как музыкантов, интересует использование синтезаторов речи в качестве вокала, при создании музыки, а также в виде плагина для нашей рабочей станции. И это тоже возможно – рассмотрим несколько подобных VST-инструментов и программ.

Aques Tone 2

Первый плагин – от японских разработчиков, со всеми вытекающими последствиями (рис.1).

Рисунок 1. Интерфейс Aques Tone 2
Рисунок 1. Интерфейс Aques Tone 2.

Неизвестно, заведомо ли японцы решили привнести некоторые ошибки, вроде «Poli» вместо «Poly», но и других японских «фишек» здесь хватает. Например, руководство пользователя доступно только на японском. Но это полбеды. Плагин заточен в основном под японские фонемы! Чтобы понять это на практике представьте, как японец произнёс бы английскую фразу, записанную в японской транскрипции.

Кроме того, органов управления не так уж и много. Основная секция здесь в верхнем окне, в котором загружается файл с нужными фразами. Почему нельзя было сделать возможность писать фразы и проигрывать их «на лету» - непонятно. Ну что ж, попробуем синтезировать какую-нибудь фразу.

Для этого нужно в любом текстовом редакторе написать её, сохранить, а затем загрузить в плагин. Возьмём, к примеру, простую фразу «Hey, yo, come on»! Для того, чтобы Aques Tone 2 распознал её более-менее адекватно, нужно написать так: «hey yo camon». И сохранить файл с расширением txt (в моём случае – hello.txt).

Теперь открываем этот файл, нажав на кнопку Open (рис. 2). Не забываем установить тип файлов «txt».

Рисунок 2. Открываем файл с «лирикой»
Рисунок 2. Открываем файл с «лирикой».

Если всё правильно загрузилось, в нашем основном окне, мы увидим записанную нами фразу – «hey yo camon».

Следующий шаг – прописать партию. Собственно, обозначить моменты, когда будет звучать каждый слог. Схема здесь такая – с нажатием каждой новой ноты проигрывается очередной слог. На рисунке 3 я подписал над каждой нотой за какой слог она отвечает.

Рисунок 3. Прописываем ноты для слогов
Рисунок 3. Прописываем ноты для слогов.

Как видим, располагаются они своим особым образом. К примеру, почему-то звук «N» отделился на отдельную ноту, а не «прилип» к слогу «MO». Да и вообще, если послушать демо-фразы, встроенные в программу, то очевидно прослушивается направленность на японский язык.

Регуляторы, представленные в этом vst-инструменте, не представляют особого интереса. Они отвечают за некоторые характеристики эмулируемого голоса. Самым ощущаемым на слух я выделил бы Gender. Он делает голос либо более «мужским», либо более «женским». Кавычки я поставил не случайно, т.к. однозначно сложно сказать – мужской ли это голос, либо женский. Также, к примеру, регулятор Resonance при очень низких значениях делает голос совершенно неестественным, а при высоких – более мягким. Остальные параметры можно «крутить» на свой вкус. Ну и напоследок хочется отметить, что доступен всего лишь один встроенный голос под именем «Lina». Впрочем, послушайте сами сэмпл из нескольких тактов созданной нами фразы – сделайте выводы. Плагин бесплатный.


Скачать (126 kb)

VirSyn Cantor 2

В отличие от предыдущего представителя, Cantor 2 представляет собой более «продвинутую» систему для синтезирования вокальных партий, но уже за денежку. Он также имеет версию в виде отдельной программы. Хотя и vst-инструмент представляет собой аналог piano-roll в секвенсоре: взгляните на интерфейс (рис. 4).

Рисунок 4. Главное окно VirSyn Cantor
Рисунок 4. Главное окно VirSyn Cantor.

Поскольку этот плагин обладает большим инструментарием, он может манипулировать большим количеством параметров голоса. Но начинать нужно всё равно с построения фразы по слогам. Как несложно догадаться, делается это посредством piano roll. Здесь же есть панель инструментов с привычными «карандашами», «ластиками» и т.п. Собственно, попробуем синтезировать упоминавшуюся выше фразу «hey, yo, come on»! Нарисуем события в виде прямоугольных областей, а также подпишем каждый из них, как на рисунке 5.

Рисунок 5. «Рисуем» фразу в piano-roll в Cantor
Рисунок 5. «Рисуем» фразу в piano-roll в Cantor.

Как можно увидеть, слова написаны над событиями не все целиком. Например, слово «come on» разбито на два слога – «com» и «on». Внимательные пользователи заметят, что внизу автоматически прописаны фонемы – это довольно удобная функция. Если вдаваться в подробности и нюансы, то нужно очень хорошо представлять себе, что такое фонемы и прочие тонкие нюансы звучания речи, доступные разве что узким специалистам. Мы просто оставим это как есть и посмотрим как оно работает в общем. Но это не всё. Теперь в самой миди-партии дорожки Cantor 2 тоже нужно прописать партию, соответственно которой будут звучать наши слова (слоги). Сделаем так, как на рисунке 6.

Рисунок 6. «Рисуем» фразу в piano-roll в секвенсоре
Рисунок 6. «Рисуем» фразу в piano-roll в секвенсоре.

Теперь можно включить проигрывание в секвенсоре и убедиться, что у нас появился некий звук на выходе.

Далее настроим некоторые нюансы звучания. Сразу оговорюсь, что для исследования всех нюансов настройки Cantor 2 нужно писать целую книгу. В рамках этой статьи мы рассмотрим общие параметры. Итак, во-первых, можно выбрать уже готовый голос. Доступно их около десятка. Открыть их можно в верхней части программы, в опции Load voice (рис. 7).

Рисунок 7. Загружаем голос
Рисунок 7. Загружаем голос.

По-умолчанию был установлен «Nikki», но я переставил его на «Luther». Можете попробовать различные голоса, как женские, так и мужские.

Во-вторых, здесь есть секция эффектов (собственно, раздел Effects, рис. 8).

Рисунок 8. Добавляем эффекты
Рисунок 8. Добавляем эффекты.

Доступно 4 эффекта – Distortion, Echodelay, Chorus и Reverb. Хотя эти же эффекты можно добавлять и отдельно.

Про секции Phoneme и Voice нет смысла рассказывать, т.к. они довольно сложны в освоении и разобраться в их настройках может разве что довольно узкий специалист. Хотя никто не мешает покрутить ручки в этих секциях и таким образом изменить звучание. Либо корпеть над теорией синтезирования речи, а также над руководством пользователя Cantor, чтобы понимать как это всё должно работать. В общем, довольно много параметров, довольно сложно и довольно примитивный звук получается в итоге.

Тем не менее, даже новичок, если постарается, сможет получить звучание, наподобие того, что получилось у меня.


Скачать (126 kb)

Fruity Loops Studio

Возможно, многие из вас, увидев Fruity Loops, удивятся, каким образом он попал в эту статью, ведь это скорее, программа для создания музыки, нежели синтезатор речи. Всё дело в том, что Fruity Loops имеет в своём арсенале очень неплохой синтезатор речи. Называется он Speech Synthesizer. И хоть его нет в виде отдельного плагина, но можно вставить сам FL как vst-плагин в вашу рабочую станцию и там уже использовать его Speech Synthesizer. Но я всё же предпочитаю создавать речевую партию в самом FL, затем экспортировать её в аудиофайл, после чего использовать в любой рабочей станции.

Итак, попробуем создать партию из предыдущего примера непосредственно в FL Studio. Вставим этот плагин в наш проект (рис.9).

Рисунок 9. Добавляем Speech Synthesizer в Fruity Loops
Рисунок 9. Добавляем Speech Synthesizer в Fruity Loops.

Как только мы добавим его в проект, автоматически появится окно, предлагающее ввести наш текст. Можно долго не думать и сразу ввести нашу фразу из примеров выше (рис. 10).

Рисунок 10. Настройки параметров речи
Рисунок 10. Настройки параметров речи.

Кроме того, можно сразу же установить и другие параметры речи, такие как голос (доступно около 20 голосов), стиль произношения, режим (шёпотом, с придыханием, либо обычный) и настройки темпа и тональности. Советую сразу настроить темп (у меня он, допустим 140, соответственно темпу проекта). Кнопка Listen позволяет прослушать партию «на лету», до её создания. После того, как мы подобрали нужные параметры нажимаем галочку, программа предложит нам сохранить наш файл с созданной речевой партией и в проекте создаётся новая партия с вокалом (рис. 11).

Рисунок 11. Новая речевая партия в проекте
Рисунок 11. Новая речевая партия в проекте.

Нам не нужно заморачиваться – Speech Synthesizer создал за нас дорожку, которая представляет собой Fruity Slicer с созданной в нём партией, разбитой по нотам, где каждому слову соответствует отдельная нота (на рисунке 11 справа как раз видно, что у нас есть партия с 4 кусочками). Кроме того, в piano roll созданы дорожки для нот с подписанными словами, что очень удобно (рис. 12).

Рисунок 12. Окно piano-roll с новой партией
Рисунок 12. Окно piano-roll с новой партией.

Всё довольно наглядно и просто. Не нужно прописывать фонемы, подбирать слоги, чтобы фраза звучала правильно. Достаточно просто ввести фразу – она будет звучать уже довольно сносно и разборчиво. Затем также просто можно переставлять слова и экспортировать партию в желаемый аудиоформат. Можно убедиться самим, прослушав пример.


Скачать (108 kb)

Что же лучше из рассмотренных синтезаторов речи?

Лично моё мнение: лучше живая речь, живой вокал. Если же выбирать из вышеупомянутых программ, то, безусловно по количеству настроек и параметров выигрывает Cantor 2. Тем более, что он претендует на звание не просто синтезатора речи, а даже вокального синтезатора. Если выбирать по удобству, простоте и качеству звучания, я отдаю предпочтение Speech Synthesizer из Fruity loops.

Дополнение от редакции

Есть ещё бесплатная программа для синтезирования речи - AnalogX SayIt. Можно настроить различные параметры и после предпрослушки сгенерировать результат в звуковой файл.

Farmatique, 25.06.2014
CJCity.ru

Комментарии (0)

Чтобы оставить комментарий, .

Пополнения софта для Windows

  • W.A. Productions ComBear v1.0.1
    W.A. Productions ComBear v1.0.121 Февраля 2022

    ComBear — чрезвычайно мощный и невероятно динамичный плагин-компрессор, с функцией параллельного сжатия. Он придает потрясающий звук и ощущение ударным, синтезатору,

  • ToneBoosters 23 plugins pack v1.6.0
    ToneBoosters 23 plugins pack v1.6.021 Февраля 2022

    ToneBoosters — это компания, которая занимается разработкой традиционных аудио-плагинов, таких как эквалайзеры, компрессоры и многое другое. Аудиоинструменты, с помощью

  • DSPplug Mark3 1.8
    DSPplug Mark3 1.819 Февраля 2022

    Mark3 - это mid/side лимитер с монофоническим, стереофоническим и расширенным режимами. Как и предыдущие предложения DSPplug, mark3 предназначен только для Windows, но поддержка

  • Guitarml TS-M1N1 1.1.0
    Guitarml TS-M1N1 1.1.019 Февраля 2022

    Бесплатный овердрайв на основе нейросетиTS-M1N3 — это гитарный плагин, клон классической педали овердрайва TS-9 Tubescreamer. Для создания модели поведения ручек драйва

  • Fanan Team Yumbu 3
    Fanan Team Yumbu 315 Февраля 2022

    Yumbu 3 — это барабанный сэмплер с молниеносной загрузкой наборов ударных и быстрым одноступенчатым управлением, приспособленный для живого использования. В новой версии

Новости музыкального софта

Новости музыкального оборудования

  • ESI planet 22c
    Dante аудиоинтерфейс ESI planet 22c 09 марта, 2022

    С помощью этого интерфейса сети Dante можно быстро и легко расширять, будь то на концертах, вещательных станциях или в зоне установки. planet...

  • микрофоны Universal Audio
    Дебютные микрофоны Universal Audio 22 февраля, 2022

    Ветераны аналогового аудио и пионеры DSP Universal Audio объявили о своем выходе на рынок микрофонов с шестью новыми моделями. Первый, по-видимому,...

  • Портативный рекордер Zoom F3
    Портативный рекордер Zoom F3 21 февраля, 2022

    Портативные полевые рекордеры становятся все более совершенными, и Zoom вносит свой вклад в развитие рынка, выпуская «проверенный в боевых...

  • Error Instruments Velix
    Error Instruments Velix, экспериментальный синтезатор с сенсорными пластинами 20 февраля, 2022

    В недрах сумасшедшей звуковой лаборатории Error Instruments появился Velix, экспериментальный синтезатор с «органическим» звуком...

  • Мобильный аудиоинтерфейс Apogee Duet 3
    Мобильный аудиоинтерфейс Apogee Duet 3 19 февраля, 2022

    Потрясающий звук никогда не выглядел так хорошо В 2007 году оригинальный Apogee Duet разрушил все представления о том, каким может быть интерфейс...