Несколько месяцев назад мне понадобилась озвучка для короткого обучающего ролика — минут на пять. Прайс диктора с биржи оказался неожиданным: от 1 000 рублей за минуту. На пять минут — пять тысяч. За озвучку, которую я, возможно, перемонтирую через неделю. Тогда я впервые серьёзно занялся нейросетевым синтезом речи. Профессиональный диктор берёт 600–1 200 рублей за минуту готового аудио. Нейросеть генерирует ту же минуту за секунды и стоит от нуля до нескольких долларов в месяц. Разрыв — десятки раз. При этом для обучающих видео, подкастов или автоматизированных роликов качество давно достаточное. Я протестировал несколько сервисов — расскажу честно. ElevenLabs — по качеству среди зарубежных инструментов пока нет равных. Бесплатный план даёт 10 000 символов в месяц (~10 минут аудио). Русский язык поддерживается, интонации живые, лёгкий «иностранный» акцент слышен лишь при внимательном прослушивании. Минус: сервис работает не у всех в России напрямую, потребуется прокси. На бесплатном п