На заметку
Новые статьи на сайте
- 4 причины, почему гитара не держит строй, и как это исправить 28 Февраля, 2026 Если ваша гитара постоянно «уходит» из строя — не спешите винить струны или производителя. Чаще всего проблема решается простыми действиями. Разберём 4 главные причины и их решения....
- Музыка человека против музыки нейросети: где граница творчества? 13 Февраля, 2026 Сегодня нейросети умеют генерировать мелодии, подбирать гармонии и даже имитировать стиль конкретных исполнителей. На стримингах появляются треки, созданные без участия человека, а крупные лейблы экспериментируют...
- Обзор наушников HEDD HEDDphone D1: когда точность важнее пафоса 13 Февраля, 2026 Флагманские студийные наушники от немецкой компании HEDD. Их ключевая фишка — технология Open Sound (открытое акустическое оформление)....
- Обзор наушников Focal Lensys Professional: студийные мониторы премиум‑класса 30 января, 2026 Закрытые студийные наушники флагманского уровня с эталонной детализацией и нейтральным звучанием....
- Обзор наушников RODE NTH-50: студийные мониторы за разумные деньги 22 января, 2026 RODE NTH-50 — это закрытые студийные наушники с точным балансом, предназначенные для сведения, мастеринга и мониторинга. Они сочетают доступную цену, продуманную эргономику и честный, не приукрашенный звук....
- Обзор микрофонов AKG серии C: качество студийного уровня для разных задач 22 января, 2026 Компания AKG известна микрофонами премиум-класса, которые десятилетиями используются в профессиональных студиях. Серия AKG C объединяет модели для вокала, инструментов и живых выступлений. Разберёмся, что отличает...
- 9 способов добавить пространства в микс 22 Февраля, 2022 Есть много элементов, которые объединяются в великолепный современный микс, и пространство, без сомнения, является одним из самых важных....
- 6 ошибок музыкантов, касающихся финансов 19 Февраля, 2022 Музыкальные биографии изобилуют историями о блестящих талантах, которые остались ни с чем и были вынуждены уйти из индустрии просто потому, что допустили несколько элементарных ошибок....
- 10 профессиональных советов по добавлению мощи и панча в микс 15 Февраля, 2022 Достижение широкого, мощного звука, слышимого в лучших профессиональных миксах, является святым Граалем для большинства продюсеров и инженеров. Лучшие и продаваемые на сегодняшний день релизы обеспечивают идеальный...
- Особенности сведения и мастеринга для сервисов цифровой дистрибуции и стримингов 10 Февраля, 2022 На протяжении десятилетий многие производители музыкальной индустрии и звукоинженеры были вовлечены в настоящую гонку вооружений. С момента зарождения музыки как продукта средств массовой информации, перенесенного...
Читайте также
- Обработка звука Обработка звука бывает разноплановой и зависит от целей, которые вы преследуете. Это может быть подавление шумов, наложение звуковых фильтров, добавление реверберации или дилея, выведение на передний план...

Синтезаторы речи для «продвинутых»

Каждый из нас, наверняка сталкивался тем или иным образом с синтезатором речи. В общем и целом их называют «преобразователями из текста в речь» или, более распространённая аббревиатура – TTS (Text-to-speech). Сейчас любой желающий может зайти в переводчик Google и услышать собственными ушами, как работают подобные системы. Было время когда эту технологию активно внедряли в различные системы перевода. Но нас, как музыкантов, интересует использование синтезаторов речи в качестве вокала, при создании музыки, а также в виде плагина для нашей рабочей станции. И это тоже возможно – рассмотрим несколько подобных VST-инструментов и программ.

Aques Tone 2

Первый плагин – от японских разработчиков, со всеми вытекающими последствиями (рис.1).

Рисунок 1. Интерфейс Aques Tone 2.

Неизвестно, заведомо ли японцы решили привнести некоторые ошибки, вроде «Poli» вместо «Poly», но и других японских «фишек» здесь хватает. Например, руководство пользователя доступно только на японском. Но это полбеды. Плагин заточен в основном под японские фонемы! Чтобы понять это на практике представьте, как японец произнёс бы английскую фразу, записанную в японской транскрипции.

Кроме того, органов управления не так уж и много. Основная секция здесь в верхнем окне, в котором загружается файл с нужными фразами. Почему нельзя было сделать возможность писать фразы и проигрывать их «на лету» - непонятно. Ну что ж, попробуем синтезировать какую-нибудь фразу.

Для этого нужно в любом текстовом редакторе написать её, сохранить, а затем загрузить в плагин. Возьмём, к примеру, простую фразу «Hey, yo, come on»! Для того, чтобы Aques Tone 2 распознал её более-менее адекватно, нужно написать так: «hey yo camon». И сохранить файл с расширением txt (в моём случае – hello.txt).

Теперь открываем этот файл, нажав на кнопку Open (рис. 2). Не забываем установить тип файлов «txt».

Рисунок 2. Открываем файл с «лирикой».

Если всё правильно загрузилось, в нашем основном окне, мы увидим записанную нами фразу – «hey yo camon».

Следующий шаг – прописать партию. Собственно, обозначить моменты, когда будет звучать каждый слог. Схема здесь такая – с нажатием каждой новой ноты проигрывается очередной слог. На рисунке 3 я подписал над каждой нотой за какой слог она отвечает.

Рисунок 3. Прописываем ноты для слогов.

Как видим, располагаются они своим особым образом. К примеру, почему-то звук «N» отделился на отдельную ноту, а не «прилип» к слогу «MO». Да и вообще, если послушать демо-фразы, встроенные в программу, то очевидно прослушивается направленность на японский язык.

Регуляторы, представленные в этом vst-инструменте, не представляют особого интереса. Они отвечают за некоторые характеристики эмулируемого голоса. Самым ощущаемым на слух я выделил бы Gender. Он делает голос либо более «мужским», либо более «женским». Кавычки я поставил не случайно, т.к. однозначно сложно сказать – мужской ли это голос, либо женский. Также, к примеру, регулятор Resonance при очень низких значениях делает голос совершенно неестественным, а при высоких – более мягким. Остальные параметры можно «крутить» на свой вкус. Ну и напоследок хочется отметить, что доступен всего лишь один встроенный голос под именем «Lina». Впрочем, послушайте сами сэмпл из нескольких тактов созданной нами фразы – сделайте выводы. Плагин бесплатный.

Скачать (126 kb)

VirSyn Cantor 2

В отличие от предыдущего представителя, Cantor 2 представляет собой более «продвинутую» систему для синтезирования вокальных партий, но уже за денежку. Он также имеет версию в виде отдельной программы. Хотя и vst-инструмент представляет собой аналог piano-roll в секвенсоре: взгляните на интерфейс (рис. 4).

Рисунок 4. Главное окно VirSyn Cantor.

Поскольку этот плагин обладает большим инструментарием, он может манипулировать большим количеством параметров голоса. Но начинать нужно всё равно с построения фразы по слогам. Как несложно догадаться, делается это посредством piano roll. Здесь же есть панель инструментов с привычными «карандашами», «ластиками» и т.п. Собственно, попробуем синтезировать упоминавшуюся выше фразу «hey, yo, come on»! Нарисуем события в виде прямоугольных областей, а также подпишем каждый из них, как на рисунке 5.

Рисунок 5. «Рисуем» фразу в piano-roll в Cantor.

Как можно увидеть, слова написаны над событиями не все целиком. Например, слово «come on» разбито на два слога – «com» и «on». Внимательные пользователи заметят, что внизу автоматически прописаны фонемы – это довольно удобная функция. Если вдаваться в подробности и нюансы, то нужно очень хорошо представлять себе, что такое фонемы и прочие тонкие нюансы звучания речи, доступные разве что узким специалистам. Мы просто оставим это как есть и посмотрим как оно работает в общем. Но это не всё. Теперь в самой миди-партии дорожки Cantor 2 тоже нужно прописать партию, соответственно которой будут звучать наши слова (слоги). Сделаем так, как на рисунке 6.

Рисунок 6. «Рисуем» фразу в piano-roll в секвенсоре.

Теперь можно включить проигрывание в секвенсоре и убедиться, что у нас появился некий звук на выходе.

Далее настроим некоторые нюансы звучания. Сразу оговорюсь, что для исследования всех нюансов настройки Cantor 2 нужно писать целую книгу. В рамках этой статьи мы рассмотрим общие параметры. Итак, во-первых, можно выбрать уже готовый голос. Доступно их около десятка. Открыть их можно в верхней части программы, в опции Load voice (рис. 7).

Рисунок 7. Загружаем голос.

По-умолчанию был установлен «Nikki», но я переставил его на «Luther». Можете попробовать различные голоса, как женские, так и мужские.

Во-вторых, здесь есть секция эффектов (собственно, раздел Effects, рис. 8).

Рисунок 8. Добавляем эффекты.

Доступно 4 эффекта – Distortion, Echodelay, Chorus и Reverb. Хотя эти же эффекты можно добавлять и отдельно.

Про секции Phoneme и Voice нет смысла рассказывать, т.к. они довольно сложны в освоении и разобраться в их настройках может разве что довольно узкий специалист. Хотя никто не мешает покрутить ручки в этих секциях и таким образом изменить звучание. Либо корпеть над теорией синтезирования речи, а также над руководством пользователя Cantor, чтобы понимать как это всё должно работать. В общем, довольно много параметров, довольно сложно и довольно примитивный звук получается в итоге.

Тем не менее, даже новичок, если постарается, сможет получить звучание, наподобие того, что получилось у меня.

Скачать (126 kb)

Fruity Loops Studio

Возможно, многие из вас, увидев Fruity Loops, удивятся, каким образом он попал в эту статью, ведь это скорее, программа для создания музыки, нежели синтезатор речи. Всё дело в том, что Fruity Loops имеет в своём арсенале очень неплохой синтезатор речи. Называется он Speech Synthesizer. И хоть его нет в виде отдельного плагина, но можно вставить сам FL как vst-плагин в вашу рабочую станцию и там уже использовать его Speech Synthesizer. Но я всё же предпочитаю создавать речевую партию в самом FL, затем экспортировать её в аудиофайл, после чего использовать в любой рабочей станции.

Итак, попробуем создать партию из предыдущего примера непосредственно в FL Studio. Вставим этот плагин в наш проект (рис.9).

Рисунок 9. Добавляем Speech Synthesizer в Fruity Loops.

Как только мы добавим его в проект, автоматически появится окно, предлагающее ввести наш текст. Можно долго не думать и сразу ввести нашу фразу из примеров выше (рис. 10).

Рисунок 10. Настройки параметров речи.

Кроме того, можно сразу же установить и другие параметры речи, такие как голос (доступно около 20 голосов), стиль произношения, режим (шёпотом, с придыханием, либо обычный) и настройки темпа и тональности. Советую сразу настроить темп (у меня он, допустим 140, соответственно темпу проекта). Кнопка Listen позволяет прослушать партию «на лету», до её создания. После того, как мы подобрали нужные параметры нажимаем галочку, программа предложит нам сохранить наш файл с созданной речевой партией и в проекте создаётся новая партия с вокалом (рис. 11).

Рисунок 11. Новая речевая партия в проекте.

Нам не нужно заморачиваться – Speech Synthesizer создал за нас дорожку, которая представляет собой Fruity Slicer с созданной в нём партией, разбитой по нотам, где каждому слову соответствует отдельная нота (на рисунке 11 справа как раз видно, что у нас есть партия с 4 кусочками). Кроме того, в piano roll созданы дорожки для нот с подписанными словами, что очень удобно (рис. 12).

Рисунок 12. Окно piano-roll с новой партией.

Всё довольно наглядно и просто. Не нужно прописывать фонемы, подбирать слоги, чтобы фраза звучала правильно. Достаточно просто ввести фразу – она будет звучать уже довольно сносно и разборчиво. Затем также просто можно переставлять слова и экспортировать партию в желаемый аудиоформат. Можно убедиться самим, прослушав пример.

Скачать (108 kb)

Что же лучше из рассмотренных синтезаторов речи?

Лично моё мнение: лучше живая речь, живой вокал. Если же выбирать из вышеупомянутых программ, то, безусловно по количеству настроек и параметров выигрывает Cantor 2. Тем более, что он претендует на звание не просто синтезатора речи, а даже вокального синтезатора. Если выбирать по удобству, простоте и качеству звучания, я отдаю предпочтение Speech Synthesizer из Fruity loops.

Дополнение от редакции

Есть ещё бесплатная программа для синтезирования речи - AnalogX SayIt. Можно настроить различные параметры и после предпрослушки сгенерировать результат в звуковой файл.

Farmatique, 25.06.2014
CJCity.ru

Комментарии (0)

Чтобы оставить комментарий, .

Пополнения софта для Windows

W.A. Productions ComBear v1.0.121 Февраля 2022
ComBear — чрезвычайно мощный и невероятно динамичный плагин-компрессор, с функцией параллельного сжатия. Он придает потрясающий звук и ощущение ударным, синтезатору,
ToneBoosters 23 plugins pack v1.6.021 Февраля 2022
ToneBoosters — это компания, которая занимается разработкой традиционных аудио-плагинов, таких как эквалайзеры, компрессоры и многое другое. Аудиоинструменты, с помощью
DSPplug Mark3 1.819 Февраля 2022
Mark3 - это mid/side лимитер с монофоническим, стереофоническим и расширенным режимами. Как и предыдущие предложения DSPplug, mark3 предназначен только для Windows, но поддержка
Guitarml TS-M1N1 1.1.019 Февраля 2022
Бесплатный овердрайв на основе нейросетиTS-M1N3 — это гитарный плагин, клон классической педали овердрайва TS-9 Tubescreamer. Для создания модели поведения ручек драйва
Fanan Team Yumbu 315 Февраля 2022
Yumbu 3 — это барабанный сэмплер с молниеносной загрузкой наборов ударных и быстрым одноступенчатым управлением, приспособленный для живого использования. В новой версии

ВСЕ ПРОГРАММЫ/ПЛАГИНЫ

Новости музыкального софта

Обзор Bitwig Studio 6: цифровая звуковая рабочая станция для современных музыкантов 13 апреля, 2026
Bitwig Studio 6 — это мощная DAW (цифровая звуковая рабочая станция), сочетающая интуитивный интерфейс с продвинутыми инструментами...
Ableton Live 12.4: что нового в обновлении 13 февраля, 2026
В последней версии Ableton Live 12.4 разработчики добавили несколько значимых функций и улучшили существующие устройства. Разберём ключевые...
Roland выпустила плагин CR‑78: культовая драм‑машина 1978 года теперь в DAW 22 января, 2026
Компания Roland официально выпустила плагин CR-78 — цифровую версию легендарной аналоговой драм-машины 1978 года. Инструмент доступен в экосистеме...
United Plugins Mirror – реверсивный дилей обновлён до версии 1.1 22 февраля, 2022
UnitedPlugins обновил свой последний плагин и добавил новую функцию. В версии 1.1 Mirror позволяет вам использовать свою фирменную обратную...
WA Production Heat v2 distortion 21 февраля, 2022
WA Productions представляют HEAT 2 - оригинальную мощную станцию с двойным искажением, теперь с потрясающим обновлением. Этот плавящий мозг...

ВСЕ НОВОСТИ МУЗЫКАЛЬНОГО СОФТА

Новости музыкального оборудования

Обзор микрофона Warm Audio WA‑87JR: доступный аналог классического студийного инструмента 13 апреля, 2026
Микрофон Warm Audio WA‑87JR — это бюджетная версия легендарного студийного конденсаторного микрофона Neumann U 87. Разберёмся,...
Korg анонсировала аудиоинтерфейсы microAUDIO 22 и microAUDIO 722 14 февраля, 2026
Korg анонсировала новую линейку аудиоинтерфейсов microAUDIO, которые сочетают в себе предусилители с интересными эффектами, включая аналоговый...
Roland GO:Mixer Studio: компактный микшер и аудио‑MIDI‑интерфейс для iOS‑устройств 22 января, 2026
Компания Roland представила GO:Mixer Studio — устройство, объединяющее функции микшера, аудио- и MIDI?интерфейса. Оно создано для мобильных...
Korg Phase 8: не просто синтезатор — а акустический восьмиголосный инструмент нового типа 22 января, 2026
Компания Korg представила Phase 8 — инструмент, ломающий привычные рамки. Это не аналоговый и не цифровой синтезатор, а нечто принципиально...
Akai MPC XL: новый флагман линейки. Что он даёт музыкантам 22 января, 2026
В мире музыкального продакшена Akai MPC давно стал именем нарицательным. Серия, начавшаяся в 1988 году с MPC60, определила звучание хип‑хопа,...