Апрель стал месяцем, когда нейросети окончательно перестали быть просто «чатами для текста». Теперь они пишут код, ведут исследование, создают изображения, собирают отчеты, работают голосом, делают презентации и подключаются к рабочим сервисам. Разбираем, что обновилось у главных ИИ-платформ и какие фишки стоит попробовать уже сейчас.
Коротко: что изменилось
Главные игроки месяца — ChatGPT, DeepSeek, Gemini, Grok и Claude.
Если совсем кратко:
- ChatGPT стал сильнее в сложной работе, коде, документах, таблицах и изображениях.
- DeepSeek выпустил V4 Preview с контекстом до 1 млн токенов.
- Gemini усилил исследовательские агенты, изображения, музыку, блокноты и голос.
- Grok сделал большой шаг в голосовых агентах и распознавании речи.
- Claude прокачал кодинг, дизайн, презентации и работу с визуальными материалами.
ChatGPT: больше не просто ответ, а готовая работа
Главное обновление ChatGPT — GPT-5.5. OpenAI называет модель самой сильной для профессиональной работы: она лучше понимает сложные цели, использует инструменты, проверяет результат и доводит многошаговые задачи до конца. В официальных материалах отдельно выделяют кодинг, онлайн-исследования, анализ данных, документы, таблицы и работу с разными инструментами.
Что стало полезнее:
- можно давать неидеальный, «сырой» запрос и получать более собранный результат;
- модель лучше держит контекст в больших задачах;
- стала сильнее в работе с кодом и реальными задачами из репозиториев;
- лучше подходит для отчетов, исследований, таблиц, презентаций и планов.
Есть и цифры. В тесте Terminal-Bench 2.0 GPT-5.5 получил 82,7% против 75,1% у GPT-5.4. В GDPval, где оцениваются профессиональные рабочие задачи, показатель составил 84,9%. В OfficeQA Pro — 54,1%, что особенно важно для тех, кто работает с офисными документами и корпоративными знаниями.
Еще одна заметная новинка — ChatGPT Images 2.0. Модель лучше работает с текстом на изображениях, многоязычными макетами, инфографикой, комиксами, постерами, рекламными материалами и визуальными объяснениями. Это уже не просто генератор красивых картинок, а инструмент для маркетологов, дизайнеров, преподавателей и авторов контента.
Для команд появились workspace agents — рабочие агенты, которые могут выполнять длинные процессы внутри компании с учетом прав доступа и настроек организации. Это шаг к ИИ, который не только отвечает, но и берет на себя повторяющиеся бизнес-задачи.
Полезная фишка: попробуйте давать ChatGPT не одну маленькую задачу, а весь процесс целиком: «собери данные, сделай выводы, оформи таблицу, предложи структуру поста и проверь слабые места». Новые модели лучше справляются именно с такими цепочками.
DeepSeek: длинный контекст и открытая модель
Главное обновление DeepSeek — DeepSeek-V4 Preview. Платформа заявила два варианта модели: V4-Pro и V4-Flash. V4-Pro имеет 1,6 трлн общих параметров и 49 млрд активных, а V4-Flash — 284 млрд общих и 13 млрд активных параметров. Оба варианта поддерживают контекст до 1 млн токенов.
Почему это важно? Контекст в 1 млн токенов позволяет загружать большие документы, длинные переписки, отчеты, кодовые базы и материалы проекта. Модель может анализировать не кусок, а почти всю рабочую картину.
Что нового:
- режим Thinking и Non-Thinking, то есть можно выбирать глубокое рассуждение или быстрый ответ;
- V4-Pro ориентирован на сложный кодинг, математику, рассуждения и агентные задачи;
- V4-Flash сделан как более быстрый и экономичный вариант;
- модель открыта и доступна через API;
- старые deepseek-chat и deepseek-reasoner будут постепенно выведены из доступа.
Полезная фишка: DeepSeek особенно интересен тем, кто работает с большими текстами и кодом. Например, можно загрузить длинную техническую документацию и попросить модель найти противоречия, собрать краткое резюме, составить план доработок или объяснить архитектуру проекта.
Gemini: исследования, музыка, блокноты и умные визуалы
У Gemini в апреле было сразу несколько заметных обновлений. В Gemini Drop появились персонализированные изображения, подключение Google-приложений для более личных ответов, блокноты с NotebookLM, приложение для Mac, генерация музыки до 3 минут и интерактивные визуальные объяснения сложных тем.
Отдельно стоит выделить Deep Research и Deep Research Max. Это исследовательские агенты, построенные на Gemini 3.1 Pro. Они могут собирать данные из открытого веба, файлов, подключенных хранилищ и внешних источников через MCP — протокол подключения инструментов. Агент не просто пишет отчет, а строит план исследования, ищет источники, делает выводы и может создавать графики и инфографику.
Что полезно бизнесу и авторам:
- можно собирать рыночные обзоры;
- делать сравнительные таблицы по конкурентам;
- готовить аналитические отчеты;
- превращать данные в графики и презентационные материалы;
- работать с PDF, CSV, изображениями, аудио и видео как с источниками.
Для разработчиков вышел Gemini 3.1 Flash TTS Preview — модель для генерации речи из текста. Google описывает ее как выразительную, управляемую и экономичную.
Еще одно важное обновление — Gemini Embedding 2. Это модель для поиска смысла в разных типах данных: тексте, изображениях, видео, аудио и PDF. Она поддерживает вход до 8192 токенов и размер вектора от 128 до 3072. Для бизнеса это основа для умного поиска по базе знаний, каталогу, архиву документов или медиатеке.
Полезная фишка: Gemini становится сильным инструментом для исследований. Его стоит пробовать не только для текстов, но и для задач вроде «сравни рынок», «найди закономерности», «собери отчет из документов» и «объясни сложную тему через схему».
Grok: голосовые агенты становятся серьезнее
У Grok главное обновление — Grok Voice Think Fast 1.0. Это голосовой агент для API, который рассчитан на сложные разговорные сценарии: поддержку клиентов, продажи, запись на услуги, бронирование, обработку данных и работу с несколькими инструментами одновременно.
xAI пишет, что модель тестировали на реальных условиях: телефонный звук, шум, акценты, перебивания и живой диалог. Также заявлена поддержка более 25 языков. В τ-voice Bench модель заняла первое место среди голосовых агентов в сценариях ритейла, авиаперевозок и телекома.
Еще одно обновление — Speech to Text API. Теперь Grok умеет распознавать речь в 25 языках, в пакетном и потоковом режимах. Это важно для сервисов, где нужно быстро переводить звонки, голосовые сообщения или интервью в текст.
Что можно делать:
- голосового консультанта для сайта;
- бота для записи клиентов;
- помощника для кол-центра;
- расшифровку звонков;
- голосовой интерфейс для приложений.
Полезная фишка: Grok стоит смотреть тем, кто думает не только о тексте, но и о голосовом клиентском сервисе. Например, если бизнес принимает много звонков, голосовой агент может стать не игрушкой, а способом разгрузить администраторов.
Claude: код, дизайн и рабочие материалы
Claude получил сразу два сильных обновления: Claude Opus 4.7 и Claude Design.
Opus 4.7 стал прямым апгрейдом Opus 4.6. Anthropic отмечает улучшения в следовании инструкциям, мультимодальности, долгих задачах, памяти и работе с файлами. Модель принимает изображения до 2576 пикселей по длинной стороне, то есть примерно до 3,75 мегапикселя, что помогает читать сложные схемы, интерфейсы и технические материалы.
По тестам партнеров и ранних пользователей, Opus 4.7 заметно усилился в коде. Например, на 93-задачном coding benchmark результат вырос на 13% относительно Opus 4.6, а на CursorBench модель набрала 70% против 58% у Opus 4.6. Также Anthropic пишет о 21% меньшем числе ошибок в OfficeQA Pro при работе с документами.
Для разработчиков появились:
- новый уровень усилия xhigh — между high и max;
- task budgets — бюджеты задачи, чтобы управлять расходом токенов в длинных запусках;
- команда /ultrareview в Claude Code для отдельной сессии ревью кода;
- auto mode для более длинных задач с меньшим числом остановок.
Claude Design — отдельный продукт Anthropic Labs для визуальной работы. Он помогает создавать дизайны, прототипы, слайды, одностраничники, презентации, маркетинговые материалы и экспортировать результат в Canva, PDF, PPTX или HTML.
Полезная фишка: Claude сейчас особенно интересен тем, кто делает код, интерфейсы, презентации и прототипы. Можно описать идею продукта, получить каркас интерфейса, затем передать его в разработку через Claude Code.
Что это значит для обычного пользователя
Нейросети двигаются в сторону «сделай за меня процесс», а не «ответь на вопрос». Самые полезные навыки теперь такие:
- Уметь ставить задачу не одной фразой, а как рабочий процесс.
- Давать ИИ файлы, контекст, ограничения и критерии результата.
- Проверять выводы, источники и цифры.
- Использовать разные сервисы под разные задачи.
- Понимать, когда нужен быстрый ответ, а когда — глубокое рассуждение.
Что выбрать
- Если нужно писать, анализировать, кодить, делать документы и изображения — начинайте с ChatGPT.
- Если нужны большие документы, длинный контекст и открытая модель — смотрите DeepSeek.
- Если нужны исследования, визуализация данных, работа с Google-сервисами и мультимодальность — полезен Gemini.
- Если важен голос, звонки и разговорные агенты — тестируйте Grok.
- Если вы работаете с кодом, интерфейсами, дизайном и презентациями — присмотритесь к Claude.
Главный вывод: одной «лучшей» нейросети уже нет. Есть набор инструментов, и выигрывает тот, кто умеет выбирать модель под задачу.
Где учиться работать с ИИ
ИИ быстро меняется: то, что было новым пару месяцев назад, уже становится базовым навыком. Поэтому важно не просто «пробовать нейросети», а учиться работать с ними системно: ставить задачи, проверять результат, автоматизировать рутину и применять ИИ в профессии.