Новые технологии распознавания речи от OpenAI

2 октября 20242 окт 2024

2 мин

Во вторник компания OpenAI представила ряд новых инструментов, которые облегчат разработчикам создание приложений на основе ее технологии искусственного интеллекта, поскольку производитель ChatGPT борется с технологическими гигантами за лидерство в гонке генеративного ИИ. Стартап, поддерживаемый Microsoft (MSFT.O), открывает новую вкладку и заявляет, что новый инструмент реального времени, который немедленно запускается для тестирования, позволит разработчикам создавать голосовые приложения ИИ с помощью единого набора инструкций. Раньше разработчикам приходилось проходить как минимум три этапа: сначала транскрибировать аудио, затем запускать модель сгенерированного текста, чтобы придумать ответ на запрос, и, наконец, использовать отдельную модель преобразования текста в речь. Значительную часть доходов OpenAI приносят компании, которые используют ее сервисы для создания собственных приложений искусственного интеллекта, поэтому развертывание расширенных возможностей является одним из

OpenAI представляет новые инструменты для
ускоренного создания голосовых
помощников

Стартап, поддерживаемый Microsoft (MSFT.O), открывает новую вкладку и заявляет, что новый инструмент реального времени, который немедленно запускается для тестирования, позволит разработчикам создавать голосовые приложения ИИ с помощью единого набора инструкций.

Раньше разработчикам приходилось проходить как минимум три этапа: сначала транскрибировать аудио, затем запускать модель сгенерированного текста, чтобы придумать ответ на запрос, и, наконец, использовать отдельную модель преобразования текста в речь.

Значительную часть доходов OpenAI приносят компании, которые используют ее сервисы для создания собственных приложений искусственного интеллекта, поэтому развертывание расширенных возможностей является одним из ключевых моментов.

Конкуренция также обостряется по мере того, как технологические гиганты, включая компанию Alphabet (GOOGL.O), являющуюся материнской компанией Google, открывают новую вкладку и внедряют в свой бизнес модели искусственного интеллекта, способные обрабатывать различные формы информации, такие как видео, аудио и текст.

OpenAI ожидает, что в следующем году ее выручка подскочит до 11,6 миллиарда долларов с 3,7 миллиарда долларов в 2024 году, сообщило в прошлом месяце агентство Reuters. Компания также находится в процессе привлечения средств в размере 6,5 миллиарда долларов, что может оценить ее в 150 миллиардов долларов.

Во вторник OpenAI представила инструмент тонкой настройки моделей после обучения, который позволит разработчикам улучшать ответы, генерируемые моделями с помощью изображений и текста.

Процесс тонкой настройки может включать в себя обратную связь от людей, которые предоставляют модели примеры хороших и плохих ответов на основе ее ответов.

По словам OpenAI, использование изображений для тонкой настройки моделей позволит им лучше понимать изображения, что даст возможность использовать их в таких приложениях, как расширенный визуальный поиск и улучшенное обнаружение объектов для автономных транспортных средств.

Стартап также представил инструмент, который позволит более мелким моделям обучаться на основе более крупных, а также «кэширование подсказок», позволяющее сократить расходы на разработку в два раза за счет повторного использования фрагментов текста, который ИИ уже обрабатывал ранее.

Новые технологии распознавания речи от OpenAI

OpenAI представляет новые инструменты для ускоренного создания голосовых помощников

OpenAI представляет новые инструменты для
ускоренного создания голосовых
помощников