Короче, ребятушки, дошли у меня руки разобраться и с нейросетями для озвучки текста. Сам недавно столкнулся с задачкой - нужно было помочь озвучить кучу материала для подкаста, а голос уже сел после третьего дубля. Ну и полез изучать, что там нового в мире ИИ-дикторов.
Перерыл я кучу сервисов (честно говоря, даже не ожидал, что их столько!), протестировал на своих текстах и готов поделиться находками. Некоторые реально удивили качеством, другие... ну, скажем так, еще есть куда расти)).
Если хочешь поддержать - подпишись на мой Telegram-канал: https://t.me/n_seti (НЕЙРОСИЛА).
Voicebot.su - наш родненький
Начну с отечественного продукта, который меня приятно удивил. Voicebot.su делает довольно качественную озвучку на русском языке, и что важно - понимает наши особенности произношения.
Интерфейс простой, без лишних наворотов. Вставляешь текст, выбираешь голос (их там несколько мужских и женских вариантов), жмешь кнопочку - и вуаля! Особенно порадовало, что сервис неплохо справляется с ударениями в сложных словах. Правда, иногда все же промахивается, но в целом результат достойный.
Yandex SpeechKit - когда нужна надежность
Яндекс, как обычно, не подкачал. SpeechKit - это серьезный инструмент для тех, кто работает с большими объемами текста. Качество озвучки на высоте, особенно если правильно расставить ударения и знаки препинания.
Единственный минус - это не совсем простой сервис для новичков. Тут нужно немного разбираться в API и настройках. Зато если освоишь, получишь мощный инструмент для профессиональной работы. Цены адекватные, особенно если сравнивать с западными аналогами.
SteosVoice - бывший CyberVoice с новыми возможностями
Этот сервис прошел ребрендинг, но суть осталась прежней - качественная озвучка с кучей настроек. Тут можно покрутить не только скорость и высоту голоса, но и эмоциональную окраску.
Особенно впечатлила библиотека голосов - есть даже имитации известных личностей (хотя использовать их нужно осторожно, чтобы не нарваться на проблемы с авторскими правами). Для создания подкастов или озвучки роликов - самое то. Правда, за качество придется доплатить.
TTSMaker - бесплатная радость
А вот этот сервис стал для меня приятным открытием! TTSMaker предлагает довольно неплохое качество озвучки совершенно бесплатно. Конечно, есть ограничения по объему, но для небольших проектов вполне хватает.
Поддерживает кучу языков, включая русский. Голоса звучат естественно, хотя иногда проскакивает легкая роботизированность. Но учитывая, что это бесплатно - грех жаловаться! Отличный вариант для тех, кто только начинает экспериментировать с озвучкой.
Apihost - российский универсал
Этот сервис уже не раз мелькал в моих поисках, и не зря. Apihost предлагает неплохой баланс цены и качества. Больше тысячи голосов в базе - от детских до голосов знаменитостей.
Что понравилось - можно тонко настраивать интонацию и эмоции. Хочешь дружелюбный тон? Пожалуйста. Нужен строгий деловой голос? Не проблема. Правда, чтобы получить действительно хороший результат, придется повозиться с настройками. Но оно того стоит.
Silero TTS - для технарей (и не только!)
Silero - это скорее инструмент для разработчиков, но если руки растут из правильного места, можно получить отличные результаты. Это open-source решение, которое можно интегрировать в свои проекты. Качество озвучки на русском языке действительно впечатляет. Модели обучены на большом объеме данных, и это слышно. Минус - нужны технические навыки для настройки и использования. Зато если освоишь, получишь мощный инструмент практически бесплатно.
Но тут есть приятный сюрприз! Несмотря на то, что официальный сайт выглядит довольно не броско, у ребят из Silero есть очень дружелюбный бот в Telegram с большим активным сообществом. В боте доступно более 1500 голосов, включая голоса персонажей из игр и фильмов. Недавно добавили возможность переозвучки голосовых сообщений - можешь отправить свою голосовуху, а бот повторит её другим голосом, сохранив интонацию. Так что если не хочешь возиться с техническими настройками, просто заходи в их бота и экспериментируй.
NaturalReader - западный стандарт
Этот сервис больше заточен под английский язык, но и с русским справляется неплохо. NaturalReader предлагает очень естественное звучание, особенно на премиум-тарифах.
Интерфейс интуитивно понятный, есть мобильные приложения. Можно загружать документы разных форматов и сразу получать озвучку. Правда, цены кусаются - за качество приходится платить. Но если бюджет позволяет, результат стоит вложений.
Murf AI - голливудское качество
Murf - это уже серьезный уровень. Качество озвучки здесь действительно впечатляет, голоса звучат как настоящие актеры дубляжа. Есть возможность клонировать собственный голос (что, кстати, довольно забавно).
Сервис больше ориентирован на профессиональное использование - создание рекламы, обучающих материалов, презентаций. Соответственно, и цены здесь не детские. Но если нужно действительно качественное озвучивание для важного проекта - стоит попробовать.
Google Text-to-Speech - надежность гиганта
Google, как всегда, предлагает стабильное и качественное решение. Text-to-Speech интегрирован во множество сервисов и приложений, работает быстро и надежно. Можно попробовать в Google Keep.
С русским языком справляется хорошо, хотя иногда проскакивает легкий акцент. Зато цены демократичные, а стабильность работы на высоте. Если нужен надежный инструмент без излишеств - это ваш выбор.
Zvukogram - русская находка
И напоследок еще один отечественный сервис, который заслуживает внимания. Zvukogram специально заточен под русскоязычную аудиторию и это чувствуется.
Хорошая работа с ударениями, естественные интонации, возможность создавать диалоги с разными голосами. Цены адекватные, есть бесплатный лимит для тестирования. Для создания контента на русском языке - очень достойный вариант.
В общем, выбор есть на любой вкус и кошелек. Главное - определиться с задачами и не бояться экспериментировать. Чтобы определиться было легче - заглядывайте в наш список нейросетей для озвучки: https://ailibri.com/text-to-speech/. Большинство сервисов предлагают бесплатное тестирование, так что можно попробовать несколько вариантов и выбрать то, что больше подходит именно вам.
А какими сервисами пользуетесь вы? Делитесь в комментах своими находками! Наш TG: https://t.me/n_seti (НЕЙРОСИЛА).