OpenAI выпустила GPT-5.4 — новую флагманскую модель, а я быстренько взяла у нее интервью, чтобы узнать, что в ней такого особенного.
— GPT-5.4 уже много обсуждают. Что это вообще за модель?
GPT-5.4 — это новая версия модели OpenAI. Если говорить совсем просто, это не просто чат-бот, который отвечает на вопросы, а система, которая становится все более полезной в реальных задачах.
Людей сейчас особенно заинтересовало не только то, что модель стала лучше писать, объяснять и анализировать, но и то, что у нее появилась очень заметная новая возможность — computer use. То есть ИИ теперь может не только что-то советовать, но и в определенных условиях работать с интерфейсом почти как человек: видеть экран, понимать, где какие кнопки, и выполнять действия.
— Звучит интересно, но что такое computer use простыми словами?
Простыми словами — это когда ИИ может пользоваться компьютером не только через текстовые команды, а через сам экран и интерфейс.
Например, раньше модель могла сказать: «Нажмите сюда, потом откройте этот раздел, затем заполните форму». А теперь идея в том, что она может помочь сделать это не только словами, но и через реальное взаимодействие с программой или сайтом.
То есть она как будто «смотрит» на экран, понимает, что перед ней, и может выполнять шаги: нажимать кнопки, вводить текст, переходить между окнами, проверять, получилось или нет.
— И почему это считают главной новинкой?
Потому что это очень сильно меняет саму роль ИИ.
Раньше ИИ в основном был чем-то вроде умного собеседника: он мог объяснить, написать письмо, помочь с идеей, перевести текст, ответить на вопрос. Это уже полезно, конечно.
Но computer use — это следующий шаг. Теперь ИИ двигается в сторону помощника, который может не только объяснить, что делать, но и участвовать в самом процессе. А это уже совсем другой уровень практической пользы.
Проще говоря: раньше ИИ говорил, как пройти путь, а теперь начинает помогать идти по нему вместе с пользователем.
— Где это может пригодиться в обычной жизни?
На самом деле почти везде, где есть скучные или повторяющиеся действия за компьютером.
Например:
* заполнение форм;
* поиск нужных разделов на сайтах;
* работа с личными кабинетами;
* перенос информации из одного сервиса в другой;
* оформление однотипных заявок;
* навигация по сложным интерфейсам.
Для обычного человека это может быть просто удобный способ быстрее справляться с цифровой рутиной. Особенно когда сайт или программа сделаны так, будто их проектировали люди, которые никогда не видели живого пользователя. Такое, увы, бывает регулярно.
— А для компаний в чем главная польза?
Для компаний это, возможно, даже еще важнее.
Потому что в бизнесе очень много задач, которые выглядят не как что-то «умное», а как обычная повседневная рутина: открыть систему, найти нужный раздел, проверить статус, скопировать данные, занести информацию в форму, скачать документ, отправить дальше.
На таких мелочах тратится огромное количество времени. И если ИИ может помочь с этими действиями, это значит экономию времени, снижение нагрузки на сотрудников и ускорение процессов.
Особенно это важно там, где нет нормальной автоматизации или где старые программы неудобны для интеграций. Если у системы нет API, но есть экран, кнопки и поля, то ИИ с computer use получает шанс работать с ней почти как человек.
— То есть ИИ теперь уже не просто пишет тексты?
Да, в этом и суть перемен.
Еще недавно основное впечатление от ИИ было таким: «О, он умеет писать тексты, отвечать на вопросы и что-то объяснять». Сейчас этого уже недостаточно, чтобы удивить рынок.
Теперь важнее другое: может ли ИИ реально помочь довести задачу до результата. Не только рассказать, как оформить заявку, а помочь ее оформить. Не только объяснить, где что находится в системе, а провести пользователя через все шаги.
То есть ИИ становится не просто источником информации, а инструментом действия.
— А это вообще надежно? Не опасно ли доверять ИИ работу с интерфейсами?
Вот это как раз очень важный вопрос.
Когда ИИ просто отвечает текстом, его ошибка обычно означает, что он дал неточную информацию. Это неприятно, но не всегда критично.
Когда ИИ начинает нажимать кнопки и вводить данные, ошибка уже может быть серьезнее. Он может выбрать не тот пункт, отправить не ту форму, изменить не ту настройку или сделать что-то не туда. Поэтому здесь резко возрастает значение контроля и безопасности.
Такие системы должны работать очень аккуратно: показывать, что именно они делают, не выполнять чувствительные действия без подтверждения, учитывать ограничения доступа и давать человеку возможность вовремя остановить процесс.
Так что да, потенциал огромный, но и требования к надежности здесь намного выше.
— Можно ли сказать, что это шаг к ИИ-агентам, которые делают работу сами?
Да, именно так это многие и воспринимают.
Computer use — это одна из ключевых технологий на пути к ИИ-агентам, которые могут не только разговаривать, но и выполнять задачи в цифровой среде. Это уже не просто «умный чат», а что-то ближе к цифровому помощнику, который может открыть нужный сервис, пройти по шагам и сделать часть работы.
Но важно понимать: пока это скорее про помощь, а не про полную самостоятельность во всем. В реальной жизни слишком много нюансов, исключений и нестандартных ситуаций. Поэтому человек все равно остается важной частью процесса — как минимум для контроля и принятия решений.
— Это может заменить людей в офисной работе?
Скорее не полностью заменить, а изменить саму работу.
Если у человека половина дня уходит на повторяющиеся действия в интерфейсах, то такую нагрузку ИИ действительно может заметно сократить. Но это не значит, что человек становится не нужен.
Обычно остается все, что связано с ответственностью, проверкой, нестандартными случаями, коммуникацией, пониманием контекста и принятием решений. ИИ хорошо подходит для рутины, но не отменяет человеческий контроль.
Так что правильнее говорить не о «замене людей», а о том, что часть скучной цифровой работы можно будет передать системе.
— Почему именно сейчас вокруг этого столько внимания?
Потому что это выглядит как следующий большой этап в развитии ИИ.
Сначала всех впечатляло, что модель умеет поддерживать диалог и писать тексты. Потом — что она может анализировать изображения, код, документы, таблицы. А теперь на первый план выходит вопрос: может ли она действовать в цифровом мире так, чтобы от этого была реальная практическая польза?
И вот здесь computer use очень хорошо отвечает на этот запрос. Это понятная, наглядная и очень прикладная функция. Люди сразу видят, зачем она нужна.
— Если подытожить, в чем главный смысл этой новинки?
Если совсем просто, то главный смысл в том, что ИИ становится ближе к настоящему цифровому помощнику.
Не только отвечает. Не только объясняет. Но и помогает делать.
Именно поэтому вокруг GPT-5.4 так много разговоров. Новая модель интересна не только тем, что стала «умнее» в обычном смысле, но и тем, что делает шаг в сторону реального выполнения задач на компьютере. А это уже история не только про технологии, но и про то, как вообще будет меняться работа с цифровыми сервисами в ближайшие годы.
Понравилось? Напиши в комментариях и не забудь подписаться.
До новых встреч!