Найти тему
Олег Гаджетов

Синтез речи: Подборка лучших TTS синтезаторов на сегодняшний день | ТОП 20

Синтез речи на сегодняшний день технология крайне востребованная. Преобразование текста в звук применимо во многих сферах: программирование, озвучка новостей, озвучивание книг, звуковое сопровождение в компьютерных программах, мобильных приложениях и т.д.

Синтез речи играет далеко не последнюю роль в создании контента для YouTube да и в целом дает возможность наладить автоматизацию производства контента.

В этой заметке я решил собрать самые популярные и качественные синтезаторы.

1. AiMyVoice - недавно созданный и уникальный в своем роде сервис синтеза речи, который позволяет озвучить текст различными голосами высокого качества. На данный момент это самая качественная озвучка на русском языке, которую доводилось встречать.

-2

Рабочий проект выполнен в образе текстового документа очень напоминающего Word. Каждую реплику можно озвучивать различными голосами.

-3

Например, такой функционал отлично подойдет новостным изданиям у которых частенько публикуются интервью в текстовом формате. Теперь помимо статьи можно подключить и озвучку. Или же озвучка книг заиграет новыми красками, теперь герои будут говорить разными голосами.

Проектная работа куда удобнее классического и бедного на функционал "текстового блока с кнопкой озвучить", который присущ таким сервисам. Проект сохраняется в профиле аккаунта и его в любой момент можно изменить.

Для получения максимально качественной озвучки есть возможность сделать разметку текста, это поможет нейросети озвучивать текст правильно или в нужном вам ключе.

-4

Можно расставить паузы, интонации, ударения, громкость, темп и даже правила озвучивания. Для этого есть специальные теги, о которых подробно написано в технической поддержке сервиса.

Это позволяет получить качественную и живую речь, как будто текст зачитывает настоящий диктор.

В базе 16 уникальных голосов стоимостью от 1 до 5 рублей за минуту озвучки. Помимо классических дикторов есть голос деда Мороза, Ленина, мультяшные, детский.

-5

Посмотреть возможности сервиса и озвучить небольшие отрывки текста можно бесплатно.

2. Yandex SpeechKit - технология синтеза речи от компании Яндекс. Услуга синтезирования платная, но есть демо в котором можно озвучивать небольшие куски текста.

-6

На выбор предоставлено 8 голосов с возможностью выбора языка. Поддерживаемые языки: русский, английский и турецкий.

3. Синтез речи от ЦРТ - это реалистичный синтез русской речи на основе нейросетей.

-7

Предоставлено на выбор 4 голоса с различной частотой. Как и у Яндекса - технология платная, но демо-версия позволяет совершенно бесплатно озвучивать небольшие объемы текста.

ЦРТ — это российская компания, которая занимается разработкой инновационных систем в сфере технологий синтезирования и распознавания речи, анализа информации, лиц, голосовой и мультимодальной биометрии.

4. Синтез речи VSrobotics - это синтезатор от компании которая занимается разработкой решений в области бизнеса и IT.

-8

Присутствует 6 голосовых движков с различной частотой (8 и 24 кГц).

Демо-версия позволяет озвучивать 500 символов за один раз, ограничений на повтор озвучки нет.

5. Синтез речи от Tinkoff - синтез речи от Тинькофф, который был разработан для банка. Присутствует два голоса - мужской и женский. Но в демо-версии можно протестировать только женский голос.

-9

Зато нет таких строгих ограничений по количеству текста, допускается текст до 5 000 символов.

6. Синтез речи от Mail.ru - это голосовой помощник Маруся с навыками синтеза речи, TTS для озвучки текста на данный момент нет, но этот голосовой движок пригодится для озвучки новостей из раздела Mail.News.

-10

7. Озвучка при помощи Яндекс Алисы - Алиса это голосовой помощник, который недавно наделили возможностью озвучивать веб-страницы. Функционал уже встроен в Яндекс браузер.

-11

Устанавливаем браузер, открываем нужную страницу, выделяем текст и в контекстном меню вызываем функцию озвучить. Также можно озвучивать свой текст. Для этого в блокноте нужно напечатать текст и сохранить документ в формате html. Сохраненную веб-страницу открываем в браузере и озвучиваем текст.

8. Texttospeech - веб-ресурс с подборкой голосовых движков для разных стран мира. В базе имеется 145 голосов и она постоянно пополняется.

-12

Поддерживаются языковые пакеты: Россия, Украина, Казахстан, США, Польша, Франция, Германия, Италия, Испания, Швеция, Португалия, Бразилия, Турция, Япония.

За один раз можно синтезировать 1000 символов, можно настраивать высоту, скорость и формат аудио.

9. ApiHost - сервис занимающийся синтезом речи на основе существующих движков, записью голоса и искажением, а также анализом текста.

-13

TTS V1 имеет в наборе 22 голоса и поддержку четырех языков.
TTS V2 поддерживает 2 языка и 4 голоса.
TTS V5 поддерживает 15 языковых пакетов и 7 голосов.
За один раз можно синтезировать 1000 символов.

10. TexttoSpeechRobot - ресурс с множеством TTS под разные страны. Каждый tts'ник имеет много голосов на выбор, например русский имеет 23 голоса.

-14

Длина текста которую можно синтезировать за раз - 2000 символов.

11. Zvukogram - сервис озвучки текста который в своих базах имеет реалистичные голоса на основе нейросетей, есть премиальные голоса, они имеют пометку *pro.

-15

Сервис не имеет ограничений по тексту. Можно сразу озвучить большую статью. Также можно создавать диалоги разными голосами.

Но все же кое какие ограничения имеются. Звукограм - это платный сервис, но не дорогой! Платность гарантирует развитие проекта, появление новых возможностей и долгую жизнь проекта.

За каждую озвучку списываются токены. Тарифы на озвучку просты и очень доступны:

  • Обычный голос 1000 символов - 1 токен.
  • Pro голос 1000 символов - 5 токенов.

Изначально на балансе имеется 5 токенов, чтобы протестировать возможности сервиса. Сервис работает без регистрации тоже, но токены списываются. Думаю, что можно использовать VPN или подобные инструменты чтобы использовать его бесплатно.

12. Unitools.Tech - качественная озвучка текста онлайн, сервис очень похож на предыдущий из нашего списка. Есть поддержка 6 языков, в наличии 13 голосов, но после регистрации будет доступно больше качественных голосов.

-16

13. OddCast - сервис синтеза речи с голосами Vocalware, а также голосами Nuance, такими как Daniel (голос MLG) и Samantha (старый голос Siri). Поддерживаются 24 языка, русского к сожалению нет.

-17

Синтез сопровождается анимированным изображением персонажа, можно выбрать женский, мужской или облик животного.

14. NaturalReaders - сервис синтеза речи на основе голосов из Acapela, AT&T, Nuance и других, есть бесплатная пробная версия, но в ней нет PRO-версий голосов. Подойдет для озвучивания англоязычной информации.

-18

15. Acapela-box - tts от разработчиков голосовых движков acapela. Синтезатор устаревший и главное пользоваться им можно только имея платный аккаунт. При тестировании демо-версии звук сопровождается мелодией.

-19

16. TTSmp3 - простенький mp3 блокнот для перевода текст в звук. В базе имеется несколько десятков языковых пакетов, в том числе и русский, правда русские голоса самые простые, взятые с балаболки.

-20

17. Google Cloud Text-to-Speech - синтез речи от компании Google, голоса используются WaveNet. Сервис платный, но демка дает возможность оценить возможности и даже озвучивать бесплатно небольшие куски текста.

-21

Для озвучки английского текста одно из лучших решений.

18. VoiceMaker - название сервиса говорит само за себя. Инструментарий позволяет синтезировать аудио из текста и применять звуковые эффекты. В базе имеются хорошие голоса для синтеза английской речи, в том числе на основе нейросетей.

-22

19. MelroseLabs TTS - синтезатор от компании, которая занимается решением IT задач для бизнеса.

-23

20. IBM Watson Text to Speech - синтезатор от компании IBM, очень похожий на синтез от Google. От недавнего времени чтобы пользовать демкой нужно регистрировать аккаунт.

-24

21. Nuance TTS - синтезатор от американской компании-разработчика ПО. Многие голоса повторяются, но есть все же уникальные, которые встречаются только в этом tts'нике.

-25

22. Wideo TTS - десятки голосов с поддержкой разных языков мира. Подойдет для озвучки англоязычных текстов. Поддержка русского есть, но голосовые движки устаревшие.

-26

23. Azure TTS - синтезатор от Microsoft.

-27

Есть еще много сайтов, но они в основном дублируют возможности выше описанных сервисов, смысла их освещать нет. В озвученных мною ресурсах многие голоса повторяются, но все же возможности настройки и ограничения у сервисов разные. Советую протестировать каждый из них, чтобы определится с наиболее подходящим под свои цели.

Если вы знаете другие качественные синтезаторы, сообщите о них в комментариях, будет интересно посмотреть.

Также знаю хорошие инструменты для синтеза на смартфонах или в браузере, в дальнейшем будут материалы и по этой части.