OpenAI выпустила аудиомодели нового поколения, которые позволяют разработчикам настраивать манеру речи своих помощников по искусственному интеллекту. Обновление включает улучшенное распознавание речи и возможность управлять стилем речи искусственного интеллекта с помощью простых текстовых команд. Согласно OpenAI, их новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe демонстрируют более низкий уровень ошибок при преобразовании речи в текст, чем предыдущие системы Whisper. Компания заявляет, что эти модели лучше работают в сложных условиях, таких как сильный акцент, шумная обстановка и разная скорость речи. Наиболее примечательной особенностью является новая модель преобразования текста в речь gpt-4o-mini-tts. Система реагирует на инструкции по стилю, такие как "говори как пират" или "расскажи это как сказку на ночь", позволяя разработчикам точно настроить способ общения голосом искусственного интеллекта. Эти возможности построены на архитектурах OpenAI GPT-4o и GPT-4o-mini, которые
OpenAI выпустил новые модели голосового искусственного интеллекта с настраиваемыми стилями речи
22 марта 202522 мар 2025
2 мин