Как сгенерировать речь по тексту и желательно бесплатно? Без API-ключей. С возможностью «накрутить» мультяшные, монструозные или роботизированные интонации на разных языках. Ранее решал задачу по переводу записи звонка в текст. А теперь обратная задача. И вот готовый код для запуска в Google Colab. ⚠ Код работает в Google Colab или любом Jupyter-окружении. !pip install -q edge-tts librosa soundfile numpy
import asyncio
import edge_tts
import librosa
import soundfile as sf
from IPython.display import Audio, display
import os # 📝 ТЕКСТ
TEXT = "Я люблю свои дашборды, запущу пайплайны бодро, фильтры все расставлю чётко, покажу начальству ловко!" Сетевые вызовы к бесплатным API иногда падают. Поэтому оборачиваем синтез в асинхронную функцию с повторными попытками: # 🔊 Загрузка аудио
FALLBACK_VOICE = "en-US-GuyNeural" # Запасной голос из Microsoft """Загружает аудио с повторными попытками. При провале возвращает None."""
async def fetch_tts(text, voice, rate, max_retries=2):
····for attem