10,2 тыс подписчиков
🔥 Для модели Voice Engine от OpenAI требуется всего лишь 15-секундный образец для клонирования голоса
⏩Для модели Voice Engine от OpenAI требуется всего лишь 15-секундный образец для клонирования голоса
⏩OpenAI предложила ограниченный доступ к платформе преобразования текста в голос Voice Engine, которой достаточно 15-секундного образца для клонирования голоса. Сгенерированный искусственным интеллектом голос способен по команде зачитывать текстовые подсказки на языке исходника или других языках.
⏩Одними из первых доступ к Voice Engine получили компания в сфере образовательных технологий Age of Learning, платформа визуального повествования HeyGen, ведущий производитель программного обеспечения для здравоохранения Dimagi, разработчик коммуникационных приложений на базе ИИ Livox и система здравоохранения Lifespan.
⏩В OpenAI поделились, что разработка Voice Engine стартовала в конце 2022 года. Технология уже поддерживает предустановленные голоса для API преобразования текста в речь и функции чтения вслух ChatGPT.
⏩Член команды разработчиков Voice Engine Джефф Харрис рассказал, что модель обучили на «сочетании лицензированных и общедоступных данных». OpenAI уточнила, что модель будет доступна примерно 10 разработчикам.
⏩Генерация текста в аудио при помощи ИИ — развивающаяся область. Большинство моделей генеративного ИИ сосредоточены на инструментальных или естественных звуках. Компании Podcastle и ElevenLabs представили свои технологии клонирования голоса, использующие нейросети.
⏩Одновременно с этим правительство США стремится ограничить неэтичное использование голосовых технологий ИИ. В прошлом месяц Федеральная комиссия по связи США запретила звонки с использованием сгенерированных ИИ голосов, поскольку ранее несколько абонентов получили спам-звонки с клонированным голосом американского президента Джо Байдена.
1 минута
31 марта 2024