Автономный ИИ-агент от OpenAI
Компания OpenAI совершила прорыв в области искусственного интеллекта, запустив первого по-настоящему автономного ИИ-агента, интегрированного в платформу ChatGPT. Этот агент, представленный 17 июля 2025 года, объединяет возможности предыдущих разработок OpenAI, включая навыки взаимодействия с веб-сайтами (Operator), глубокого анализа информации (Deep Research) и разговорной интеллигентности ChatGPT. Он способен самостоятельно выполнять сложные задачи, такие как планирование поездок, анализ данных, создание презентаций и даже автоматизация регулярных процессов, например, составление еженедельных отчётов.
На экзамене Humanity's Last Exam, разработанном для оценки способности ИИ решать задачи экспертного уровня в различных областях, агент набрал 41,6% в однократном прохождении, что более чем вдвое превышает результаты предыдущих моделей OpenAI. При использовании стратегии параллельного выполнения (до восьми попыток с выбором наиболее уверенного ответа) показатель возрастает до 44,4%. На сложном математическом тесте FrontierMath агент достиг точности 27,4% с использованием инструментов, таких как терминал для выполнения кода, что значительно превосходит предыдущие модели.
Этот ИИ-агент работает на собственной виртуальной машине, что позволяет ему динамически выбирать инструменты и подходы для выполнения задач. Пользователи могут поручать ему такие действия, как анализ конкурентов, покупка ингредиентов для рецепта или создание слайдов для презентации. Агент доступен для пользователей планов Pro, Plus и Team, с лимитами в 400 сообщений в месяц для Pro и 40 для других платных подписок. Доступ для пользователей в Европейской экономической зоне и Швейцарии пока ограничен, но ожидается в ближайшие недели.
ChatGPT для Mac: Режим конспектирования и другие обновления
OpenAI также обновила приложение ChatGPT для macOS, добавив функцию автоматического создания структурированных текстовых заметок из разговоров. Этот режим позволяет чат-боту преобразовывать диалоги в чёткие конспекты с заголовками, списками и другими элементами форматирования, что упрощает использование информации для работы, учёбы или личных проектов. Функция особенно полезна для тех, кто хочет быстро фиксировать ключевые моменты беседы в организованном виде.
Кроме того, приложение для Mac получило функцию Record Mode, доступную для пользователей плана Plus по всему миру. Этот режим позволяет записывать разговоры с ChatGPT, что удобно для анализа встреч или создания аудиозаметок. Также в приложении появилась поддержка голосового режима (Advanced Voice Mode), который обеспечивает более естественное общение с возможностью прерывания бота и выбора различных голосов. Эта функция, изначально доступная только для платных подписчиков, теперь частично открыта для бесплатных пользователей с ежедневным лимитом, хотя точные ограничения зависят от спроса.
Дополнительные нововведения OpenAI
GPT-4.5 и новые модели
В феврале 2025 года OpenAI представила GPT-4.5, модель с улучшенной производительностью в задачах письма, программирования и понимания длинных контекстов. GPT-4.5 доступна через API и для пользователей ChatGPT на платных тарифах (Pro, Plus, Team), но не поддерживает мультимодальные функции, такие как голосовой режим или обработка видео. Модель была обучена на суперкомпьютерах Microsoft Azure, что позволило увеличить её знания и снизить количество ошибок (галлюцинаций).
Расширенные возможности поиска и анализа
ChatGPT теперь поддерживает функцию ChatGPT Search, которая позволяет получать актуальную информацию из интернета, включая новости, погоду, спортивные результаты и котировки акций. Эта функция доступна для пользователей Plus и Team, а в будущем будет расширена на бесплатных пользователей. Также была представлена функция Deep Research, использующая модель o3 для создания подробных отчётов на основе анализа сотен веб-источников. Она доступна всем платным подписчикам и значительно сокращает время на исследования.
Интеграция с бизнес-инструментами
OpenAI добавила функции для бизнеса, включая интеграцию с облачными сервисами (Google Drive, SharePoint, GitHub, Dropbox) и поддержку MCP (Microsoft Cloud Platform) для доступа к внутренним данным компаний. Это позволяет, например, аналитикам создавать инвестиционные тезисы на основе корпоративных документов.
Мультимодальные возможности
В марте 2025 года ChatGPT получил расширенные возможности редактирования изображений, включая изменение стилей, добавление элементов и генерацию фотореалистичных изображений по текстовым описаниям. Модель GPT-4o, лежащая в основе этих функций, поддерживает обработку текста, изображений и аудио, что делает её универсальным инструментом для творческих и профессиональных задач.
Перспективы и влияние
Запуск автономного ИИ-агента и новых функций ChatGPT демонстрирует стремление OpenAI к созданию универсальных инструментов, которые интегрируются в повседневную жизнь и профессиональную деятельность. Эти разработки усиливают позиции компании на рынке ИИ, где она конкурирует с такими моделями, как Google Gemini, Anthropic Claude и DeepSeek R1.
Однако новые возможности вызывают и опасения. Некоторые пользователи выражают недовольство ограничениями платных подписок и качеством ответов, считая их иногда избыточно упрощёнными. Кроме того, вопросы этики и предвзятости данных остаются актуальными, и OpenAI продолжает работать над их устранением, предлагая пользователям возможность отказаться от использования их данных для обучения моделей.
В будущем OpenAI планирует интегрировать новые функции, такие как улучшенный голосовой режим с видеообработкой и поддержка более сложных задач, что сделает ChatGPT ещё более универсальным инструментом.