Синтез речи на сегодняшний день технология крайне востребованная. Преобразование текста в звук применимо во многих сферах: программирование, озвучка новостей, озвучивание книг, звуковое сопровождение в компьютерных программах, мобильных приложениях и т.д.
Синтез речи играет далеко не последнюю роль в создании контента для YouTube да и в целом дает возможность наладить автоматизацию производства контента.
В этой заметке я решил собрать самые популярные и качественные синтезаторы.
1. AiMyVoice - недавно созданный и уникальный в своем роде сервис синтеза речи, который позволяет озвучить текст различными голосами высокого качества. На данный момент это самая качественная озвучка на русском языке, которую доводилось встречать.
Рабочий проект выполнен в образе текстового документа очень напоминающего Word. Каждую реплику можно озвучивать различными голосами.
Например, такой функционал отлично подойдет новостным изданиям у которых частенько публикуются интервью в текстовом формате. Теперь помимо статьи можно подключить и озвучку. Или же озвучка книг заиграет новыми красками, теперь герои будут говорить разными голосами.
Проектная работа куда удобнее классического и бедного на функционал "текстового блока с кнопкой озвучить", который присущ таким сервисам. Проект сохраняется в профиле аккаунта и его в любой момент можно изменить.
Для получения максимально качественной озвучки есть возможность сделать разметку текста, это поможет нейросети озвучивать текст правильно или в нужном вам ключе.
Можно расставить паузы, интонации, ударения, громкость, темп и даже правила озвучивания. Для этого есть специальные теги, о которых подробно написано в технической поддержке сервиса.
Это позволяет получить качественную и живую речь, как будто текст зачитывает настоящий диктор.
В базе 16 уникальных голосов стоимостью от 1 до 5 рублей за минуту озвучки. Помимо классических дикторов есть голос деда Мороза, Ленина, мультяшные, детский.
Посмотреть возможности сервиса и озвучить небольшие отрывки текста можно бесплатно.
2. Yandex SpeechKit - технология синтеза речи от компании Яндекс. Услуга синтезирования платная, но есть демо в котором можно озвучивать небольшие куски текста.
На выбор предоставлено 8 голосов с возможностью выбора языка. Поддерживаемые языки: русский, английский и турецкий.
3. Синтез речи от ЦРТ - это реалистичный синтез русской речи на основе нейросетей.
Предоставлено на выбор 4 голоса с различной частотой. Как и у Яндекса - технология платная, но демо-версия позволяет совершенно бесплатно озвучивать небольшие объемы текста.
ЦРТ — это российская компания, которая занимается разработкой инновационных систем в сфере технологий синтезирования и распознавания речи, анализа информации, лиц, голосовой и мультимодальной биометрии.
4. Синтез речи VSrobotics - это синтезатор от компании которая занимается разработкой решений в области бизнеса и IT.
Присутствует 6 голосовых движков с различной частотой (8 и 24 кГц).
Демо-версия позволяет озвучивать 500 символов за один раз, ограничений на повтор озвучки нет.
5. Синтез речи от Tinkoff - синтез речи от Тинькофф, который был разработан для банка. Присутствует два голоса - мужской и женский. Но в демо-версии можно протестировать только женский голос.
Зато нет таких строгих ограничений по количеству текста, допускается текст до 5 000 символов.
6. Синтез речи от Mail.ru - это голосовой помощник Маруся с навыками синтеза речи, TTS для озвучки текста на данный момент нет, но этот голосовой движок пригодится для озвучки новостей из раздела Mail.News.
7. Озвучка при помощи Яндекс Алисы - Алиса это голосовой помощник, который недавно наделили возможностью озвучивать веб-страницы. Функционал уже встроен в Яндекс браузер.
Устанавливаем браузер, открываем нужную страницу, выделяем текст и в контекстном меню вызываем функцию озвучить. Также можно озвучивать свой текст. Для этого в блокноте нужно напечатать текст и сохранить документ в формате html. Сохраненную веб-страницу открываем в браузере и озвучиваем текст.
8. Texttospeech - веб-ресурс с подборкой голосовых движков для разных стран мира. В базе имеется 145 голосов и она постоянно пополняется.
Поддерживаются языковые пакеты: Россия, Украина, Казахстан, США, Польша, Франция, Германия, Италия, Испания, Швеция, Португалия, Бразилия, Турция, Япония.
За один раз можно синтезировать 1000 символов, можно настраивать высоту, скорость и формат аудио.
9. ApiHost - сервис занимающийся синтезом речи на основе существующих движков, записью голоса и искажением, а также анализом текста.
TTS V1 имеет в наборе 22 голоса и поддержку четырех языков.
TTS V2 поддерживает 2 языка и 4 голоса.
TTS V5 поддерживает 15 языковых пакетов и 7 голосов.
За один раз можно синтезировать 1000 символов.
10. TexttoSpeechRobot - ресурс с множеством TTS под разные страны. Каждый tts'ник имеет много голосов на выбор, например русский имеет 23 голоса.
Длина текста которую можно синтезировать за раз - 2000 символов.
11. Zvukogram - сервис озвучки текста который в своих базах имеет реалистичные голоса на основе нейросетей, есть премиальные голоса, они имеют пометку *pro.
Сервис не имеет ограничений по тексту. Можно сразу озвучить большую статью. Также можно создавать диалоги разными голосами.
Но все же кое какие ограничения имеются. Звукограм - это платный сервис, но не дорогой! Платность гарантирует развитие проекта, появление новых возможностей и долгую жизнь проекта.
За каждую озвучку списываются токены. Тарифы на озвучку просты и очень доступны:
- Обычный голос 1000 символов - 1 токен.
- Pro голос 1000 символов - 5 токенов.
Изначально на балансе имеется 5 токенов, чтобы протестировать возможности сервиса. Сервис работает без регистрации тоже, но токены списываются. Думаю, что можно использовать VPN или подобные инструменты чтобы использовать его бесплатно.
12. Unitools.Tech - качественная озвучка текста онлайн, сервис очень похож на предыдущий из нашего списка. Есть поддержка 6 языков, в наличии 13 голосов, но после регистрации будет доступно больше качественных голосов.
13. OddCast - сервис синтеза речи с голосами Vocalware, а также голосами Nuance, такими как Daniel (голос MLG) и Samantha (старый голос Siri). Поддерживаются 24 языка, русского к сожалению нет.
Синтез сопровождается анимированным изображением персонажа, можно выбрать женский, мужской или облик животного.
14. NaturalReaders - сервис синтеза речи на основе голосов из Acapela, AT&T, Nuance и других, есть бесплатная пробная версия, но в ней нет PRO-версий голосов. Подойдет для озвучивания англоязычной информации.
15. Acapela-box - tts от разработчиков голосовых движков acapela. Синтезатор устаревший и главное пользоваться им можно только имея платный аккаунт. При тестировании демо-версии звук сопровождается мелодией.
16. TTSmp3 - простенький mp3 блокнот для перевода текст в звук. В базе имеется несколько десятков языковых пакетов, в том числе и русский, правда русские голоса самые простые, взятые с балаболки.
17. Google Cloud Text-to-Speech - синтез речи от компании Google, голоса используются WaveNet. Сервис платный, но демка дает возможность оценить возможности и даже озвучивать бесплатно небольшие куски текста.
Для озвучки английского текста одно из лучших решений.
18. VoiceMaker - название сервиса говорит само за себя. Инструментарий позволяет синтезировать аудио из текста и применять звуковые эффекты. В базе имеются хорошие голоса для синтеза английской речи, в том числе на основе нейросетей.
19. MelroseLabs TTS - синтезатор от компании, которая занимается решением IT задач для бизнеса.
20. IBM Watson Text to Speech - синтезатор от компании IBM, очень похожий на синтез от Google. От недавнего времени чтобы пользовать демкой нужно регистрировать аккаунт.
21. Nuance TTS - синтезатор от американской компании-разработчика ПО. Многие голоса повторяются, но есть все же уникальные, которые встречаются только в этом tts'нике.
22. Wideo TTS - десятки голосов с поддержкой разных языков мира. Подойдет для озвучки англоязычных текстов. Поддержка русского есть, но голосовые движки устаревшие.
23. Azure TTS - синтезатор от Microsoft.
Есть еще много сайтов, но они в основном дублируют возможности выше описанных сервисов, смысла их освещать нет. В озвученных мною ресурсах многие голоса повторяются, но все же возможности настройки и ограничения у сервисов разные. Советую протестировать каждый из них, чтобы определится с наиболее подходящим под свои цели.
Если вы знаете другие качественные синтезаторы, сообщите о них в комментариях, будет интересно посмотреть.
Также знаю хорошие инструменты для синтеза на смартфонах или в браузере, в дальнейшем будут материалы и по этой части.