Пока все гоняются за Midjourney и ChatGPT, Google тихо выкатил зверя. Новая нейросеть Gemini Speech Generation — это не просто генератор голоса. Это полноценный актёр за кадром, который умеет плакать, смеяться и ругаться в диалоге, и всё это — бесплатно, прямо сейчас. Gemini Speech — это модуль в AI Studio от Google, который: ✅ Работает фраза: говорит и смеётся: Я не хотела ехать в этот парк! ✅ Диалоги звучат реалистично Пример: – Ты был лучшим другом, Степан... Но я выбрала Дениса. – Ну и иди ты в пень, Лариса! ✅ Контекстное окно — до 32 000 токенов! Можно озвучить целую главу книги ❌ Иногда не срабатывают “всхлипы”, “плач”, “злоба” — требует экспериментов ❌ Нет voice cloning и фильтров, как у Eleven или Minimax ❌ Большие тексты могут “ломаться” — лучше делить на куски Gemini Speech — это реально мощнейший инструмент для озвучки, особенно на русском. Он даёт контроль, эмоции, и диалоги, а не просто сухой голос. И пока он бесплатный — глупо этим не пользоваться. Если вам по
Gemini Speech — новый король озвучки? Почему ElevenLabs стоит напрячься
29 мая 202529 мая 2025
128
1 мин