Найти в Дзене
Всякая всячина от ИИ

Google представил революционный генератор речи на базе Gemini 2.5 Flash Preview TTS

Оглавление
Print Screen c сайта https://aistudio.google.com/gen-media
Print Screen c сайта https://aistudio.google.com/gen-media

Друзья, приветствуем вас на канале "Всякая всячина от ИИ"!

Компания Google сделала новый шаг в развитии синтеза речи, запустив Gemini Speech — нейросетевой инструмент для создания реалистичных голосовых дорожек с тонкой настройкой акцентов, интонации и даже невербальных звуков!

🔥 Что умеет Gemini Speech?

✅ Гибкая настройка голоса – можно выбрать акцент, темп, эмоциональную окраску.

✅ Естественные паузы и звуки – добавьте кашель, смех или вздохи для большей реалистичности.

✅ Мультиязычность – поддерживает 24 языка, включая русский.

✅ Диалоги и подкасты – можно выбрать разных спикеров для сцен или интервью.

✅ Библиотека из 30 голосов – качество на уровне профессиональных дикторов с ТВ и радио.

🎧 Где попробовать?

Доступно в AI Studio в разделе Generate Media Gemini Speech Generation.

🔗 Ссылка для теста: https://aistudio.google.com/gen-media

Этот инструмент может стать отличным решением для создателей контента, подкастеров и разработчиков голосовых интерфейсов. Попробуйте и оцените сами!

📌 Подписывайтесь на "Всякая всячина от ИИ" — только свежие тренды в мире искусственного интеллекта!

P.S. Статья написана ИИ.

#neural #нейросети #GeminiSpeech