Найти в Дзене
Новостник

OpenAI запускает GPT-5.4 с нативными возможностями использования компьютера — шаг к автономным агентам

OpenAI запускает GPT-5.4 — последнюю версию своей ИИ-модели, которая, по словам компании, объединяет улучшения в рассуждении, программировании и профессиональной работе с таблицами, документами и презентациями. Это также первая модель OpenAI с нативными возможностями использования компьютера, то есть она может работать за компьютером от вашего имени и выполнять задачи в разных приложениях. Новая модель — шаг к агентному будущему, которое стремятся построить ИИ-компании, где сеть ИИ-агентов работает в фоновом режиме, чтобы выполнять сложные задачи онлайн и внутри программного обеспечения. OpenAI представила ChatGPT Agent на фоне целого потока других агентных инструментов, появившихся в прошлом году, которые могут брать под контроль ваш компьютер для выполнения задач — например, искать и покупать ингредиенты для блюда. Пока OpenAI выводит GPT-5.4 в свой API и в свой ИИ-инструмент для программирования Codex, она разворачивает свою модель рассуждения GPT-5.4 Thinking в ChatGPT. OpenAI гово

OpenAI запускает GPT-5.4 — последнюю версию своей ИИ-модели, которая, по словам компании, объединяет улучшения в рассуждении, программировании и профессиональной работе с таблицами, документами и презентациями. Это также первая модель OpenAI с нативными возможностями использования компьютера, то есть она может работать за компьютером от вашего имени и выполнять задачи в разных приложениях.

Новая модель — шаг к агентному будущему, которое стремятся построить ИИ-компании, где сеть ИИ-агентов работает в фоновом режиме, чтобы выполнять сложные задачи онлайн и внутри программного обеспечения. OpenAI представила ChatGPT Agent на фоне целого потока других агентных инструментов, появившихся в прошлом году, которые могут брать под контроль ваш компьютер для выполнения задач — например, искать и покупать ингредиенты для блюда.

Пока OpenAI выводит GPT-5.4 в свой API и в свой ИИ-инструмент для программирования Codex, она разворачивает свою модель рассуждения GPT-5.4 Thinking в ChatGPT. OpenAI говорит, что GPT-5.4 может писать код для управления компьютерами, а также отдавать команды клавиатуре и мыши в ответ на скриншоты. GPT-5.4 также демонстрирует улучшения при работе с веб-браузерами, а также в способности более точно и эффективно вызывать инструменты и API, чтобы помогать ей завершать задачи.

Модель также лучше отвечает на вопросы, которые требуют собирать информацию из нескольких источников: OpenAI говорит, что модель «может более настойчиво искать на протяжении нескольких раундов, чтобы выявлять наиболее релевантные источники, особенно для вопросов типа “иголка в стоге сена”, и синтезировать их в ясный, хорошо обоснованный ответ». OpenAI утверждает, что GPT-5.4 — это ее «самая фактическая модель на сегодняшний день»: вероятность того, что отдельные утверждения окажутся ложными, на 33 процента ниже по сравнению с GPT-5.2.

Внутри ChatGPT GPT-5.4 Thinking будет предоставлять план своей работы для более сложных запросов, а также позволит пользователям корректировать или менять свой запрос во время ответа. «Это упрощает направление модели к точному результату, который вы хотите получить, без необходимости начинать заново или делать несколько дополнительных шагов», — говорит OpenAI. Эта функция уже доступна в веб-приложении ChatGPT и на Android, но OpenAI сообщает, что она «скоро появится» в приложении для iOS.

GPT-5.4 уже разворачивается в ChatGPT, Codex и API, а модель GPT-5.4 Thinking становится доступной пользователям Plus, Team и Pro. Также есть модель GPT-5.4 Pro для «максимальной производительности на сложных задачах», которая разворачивается в API, а также для пользователей ChatGPT Enterprise и Edu.