Вслед за набравшей популярность технологией от Google, которая позволяет озвучивать видео (автоматический дубляж), книжные издательства пытаются внедрять технологии AI для автоматического создания аудиокниг. Подробнее здесь: https://www.kommersant.ru/doc/5783327 Смогут ли такие алгоритмы ускорить и удешевить производство аудиоконтента? Основная проблема автоматического чтения текстов – интонирование и правильная расстановка смысловых ударений, в чем легко можно убедиться, послушав дубляж роликов на YouTube. При художественном чтении профессиональным чтецом отдельные фрагменты текста произносятся с большей или меньшей экспрессией, а не просто более громко или тихо. Через интонирование человек на слух может определить различные эмоциональные состояния другого человека: страх, радость, грусть, восторг и прочее. На уровне отдельных предложений эта задача легко решается за счет расстановки автором в тексте знаков препинания. Достаточно легко разработать алгоритм, произносящий предложение
AI начал вытеснять с рынка профессиональных чтецов
21 апреля 202521 апр 2025
1
3 мин