Найти тему

Компания OpenAI представляет улучшенную версию ChatGPT: GPT-4o

OpenAI запускает более быструю и дешевую версию своей модели искусственного интеллекта, которая лежит в основе чат-бота ChatGPT, стремясь удержать лидерство на все более насыщенном рынке.

В ходе прямой трансляции в понедельник OpenAI представила GPT-4o, обновленную версию модели GPT-4, которая существует уже более года. Новая большая языковая модель, обученная на огромном объеме данных из интернета, будет лучше обрабатывать текст, аудио и изображения в реальном времени. Обновления станут доступны в ближайшие недели.

Система сможет отвечать на устные вопросы аудиоответами за миллисекунды, что позволит создать более плавное взаимодействие. В демонстрации модели исследователи OpenAI и технический директор Мира Муратти провели разговор с новым ChatGPT, используя только голос, показывая, что инструмент может отвечать устно. Во время презентации чат-бот также переводил речь с одного языка на другой почти мгновенно и даже пел часть рассказа по запросу.

"Это первый раз, когда мы делаем огромный шаг вперед в взаимодействии и удобстве использования," сказала Муратти в интервью Bloomberg News. "Мы действительно делаем возможным сотрудничество с такими инструментами, как ChatGPT."

Обновление принесет множество функций для бесплатных пользователей, которые ранее были доступны только подписчикам ChatGPT Plus, таких как возможность искать ответы в интернете, разговаривать с чат-ботом и слышать ответы разными голосами, а также сохранять детали, которые бот может вспомнить в будущем.

Выпуск GPT-4o готов изменить быстро развивающийся рынок ИИ, где GPT-4 остается золотым стандартом. Растущее число стартапов и крупных технологических компаний, таких как Anthropic, Cohere и Google (Alphabet Inc.), недавно представили модели ИИ, которые, по их словам, соответствуют или превосходят GPT-4 по некоторым показателям.

Анонс OpenAI также совпадает с конференцией разработчиков Google I/O. Google, ранний лидер в области искусственного интеллекта, планирует представить больше обновлений ИИ, стремясь не отставать от OpenAI, поддерживаемого Microsoft.

В редком блоге в понедельник генеральный директор OpenAI Сэм Альтман заявил, что хотя оригинальная версия ChatGPT дала представление о том, как люди могут использовать язык для взаимодействия с компьютерами, использование GPT-4o ощущается "на порядок иначе."

"Это похоже на ИИ из фильмов; и меня все еще немного удивляет, что это реально," сказал он. "Достижение уровня человеческих ответов и выразительности оказалось большим изменением."

Два раза быстрее

Вместо использования разных моделей ИИ для обработки различных входных данных, GPT-4o — "o" означает omni — объединяет голос, текст и изображения в одну модель, что делает его быстрее предшественника. Например, если вы вводите в систему изображение, она может ответить изображением. Компания заявила, что новая модель в два раза быстрее и значительно эффективнее.

"Когда у вас есть три разные модели, которые работают вместе, это создает много задержек в процессе, и это нарушает погружение в опыт," сказала Муратти. "Но когда у вас есть одна модель, которая изначально обрабатывает аудио, текст и изображения, вы исключаете все задержки, и можно взаимодействовать с ChatGPT так же, как мы общаемся сейчас."

Но новая модель столкнулась с некоторыми проблемами. Аудио часто прерывалось, когда исследователи говорили во время демонстрации. Система ИИ также удивила аудиторию, когда, после помощи исследователю в решении задачи по алгебре, она внезапно ответила кокетливым голосом: "Ого, какой у вас наряд."

OpenAI начинает внедрение новых текстовых и визуальных возможностей GPT-4o для некоторых платных пользователей ChatGPT Plus и Team, а также скоро предложит эти возможности корпоративным пользователям. Новая версия голосового помощника будет доступна для пользователей ChatGPT Plus в ближайшие недели.

Кроме того, OpenAI объявила, что любой сможет получить доступ к GPT Store, включающему кастомизированные чат-боты, созданные пользователями. Ранее доступ к магазину имели только платные клиенты.

Спекуляции по поводу следующего запуска OpenAI стали популярной темой в Кремниевой долине в последние недели. Таинственный новый чат-бот вызвал ажиотаж среди наблюдателей за ИИ, появившись на сайте с бенчмарками и, казалось бы, соответствуя производительности GPT-4. Альтман сделал намеки на чат-бота в социальных сетях, подогревая слухи о том, что это продукт его компании. В понедельник сотрудник OpenAI подтвердил в соцсети X, что загадочный чат-бот действительно является GPT-4o.

Компания работает над широким спектром продуктов, включая технологии распознавания голоса и видео. OpenAI также разрабатывает функцию поиска для ChatGPT, как ранее сообщало Bloomberg.

В пятницу компания развеяла некоторые слухи, заявив, что в ближайшее время не планирует запуск GPT-5, ожидаемую версию своей модели, которую многие в технологическом мире считают радикально более способной, чем текущие системы ИИ. Она также заявила, что на мероприятии в понедельник не будет представлен новый поисковый продукт, который мог бы конкурировать с Google. Акции Google выросли на этой новости.

Но после завершения мероприятия Альтман поспешил продолжить спекуляции. "Скоро у нас будет еще больше новостей," написал он в соцсети X.

OpenAI
60,9 тыс интересуются