103 подписчика

OpenAI Представляет Новый аудиоинструмент, который может читать текст, имитировать голоса

3 апреля 20243 апр 2024

1 мин

OpenAI делится первыми результатами тестирования функции, которая может читать слова вслух убедительным человеческим голосом, что подчеркивает новый рубеж в развитии искусственного интеллекта и повышает риск глубоких подделок. Компания делится ранними демонстрациями и примерами использования из небольшого предварительного просмотра модели преобразования текста в речь под названием Voice Engine, которой на данный момент она поделилась примерно с 10 разработчиками, сообщил представитель. OpenAI решила отказаться от более широкого внедрения этой функции, о которой она проинформировала журналистов ранее в этом месяце. Представитель OpenAI сказал, что компания решила сократить выпуск после получения отзывов от заинтересованных сторон, таких как политики, отраслевые эксперты, преподаватели и креативщики. Согласно предыдущему брифингу для прессы, компания изначально планировала выпустить инструмент для 100 разработчиков через процесс подачи заявок. “Мы признаем, что создание речи, напоминающ

Компания делится ранними демонстрациями и примерами использования из небольшого предварительного просмотра модели преобразования текста в речь под названием Voice Engine, которой на данный момент она поделилась примерно с 10 разработчиками, сообщил представитель. OpenAI решила отказаться от более широкого внедрения этой функции, о которой она проинформировала журналистов ранее в этом месяце.

Представитель OpenAI сказал, что компания решила сократить выпуск после получения отзывов от заинтересованных сторон, таких как политики, отраслевые эксперты, преподаватели и креативщики. Согласно предыдущему брифингу для прессы, компания изначально планировала выпустить инструмент для 100 разработчиков через процесс подачи заявок.

“Мы признаем, что создание речи, напоминающей голоса людей, сопряжено с серьезными рисками, которые особенно актуальны в год выборов”, - написала компания в своем блоге в пятницу. “Мы взаимодействуем с американскими и международными партнерами из органов государственной власти, средств массовой информации, сферы развлечений, образования, гражданского общества и за его пределами, чтобы гарантировать учет их отзывов по мере нашего строительства ”.

Один из нынешних партнеров OpenAI по разработке этого инструмента, Институт нейронаук Нормана Принса при некоммерческой системе здравоохранения Lifespan, использует технологию, чтобы помочь пациентам восстановить голос. Например, инструмент использовался для восстановления голоса молодой пациентки, потерявшей способность внятно говорить из-за опухоли головного мозга, путем воспроизведения ее речи с более ранней записи для школьного проекта, говорится в сообщении компании в блоге.

Пользовательская речевая модель OpenAI также может переводить генерируемый ею звук на разные языки. Это делает его полезным для компаний, занимающихся аудиобизнесом, таких как Spotify Technology SA. Spotify уже использовала технологию в своей собственной пилотной программе для перевода подкастов популярных ведущих, таких как Лекс Фридман. OpenAI также рекламировала другие полезные приложения технологии, такие как создание более широкого диапазона голосов для создания образовательного контента для детей.