OpenAI объявила о запуске нового инструмента под названием Voice Engine. Это технология клонирования голоса, которая позволяет имитировать речь любого человека после анализа 15-секундного аудиосэмпла. Компания заявляет, что Voice Engine генерирует «естественно звучащую речь» с «эмоциональными и реалистичными голосами». Основой для этой технологии послужило уже существующее API преобразования текста в речь, которое OpenAI разрабатывает с 2022 года. Компания уже использует этот инструмент для поддержки...
OpenAI продолжает расширять возможности применения искусственного интеллекта. Компания поделилась результатами разработки нейросети Voice Engine, которая на основе текста или голоса способна создать 15-секундный аудио сэмпл. Нейросеть генерирует естественно звучащую речь. Примечательно, что текущая модель способна создавать эмоциональные и реалистичные голоса. Voice Engine разработана в конце 2022 года. Нейросеть ранее использовалась для поддержки предустановленных голосов, доступных в API софта для преобразования текста в речь, а также в продуктах ChatGPT Voice и Read Aloud...