Добавить в корзинуПозвонить
Найти в Дзене

Все главные обновления нейросетей за апрель: ChatGPT, DeepSeek, Gemini, Grok и Claude

Апрель стал месяцем, когда нейросети окончательно перестали быть просто «чатами для текста». Теперь они пишут код, ведут исследование, создают изображения, собирают отчеты, работают голосом, делают презентации и подключаются к рабочим сервисам. Разбираем, что обновилось у главных ИИ-платформ и какие фишки стоит попробовать уже сейчас. Главные игроки месяца — ChatGPT, DeepSeek, Gemini, Grok и Claude. Если совсем кратко: Главное обновление ChatGPT — GPT-5.5. OpenAI называет модель самой сильной для профессиональной работы: она лучше понимает сложные цели, использует инструменты, проверяет результат и доводит многошаговые задачи до конца. В официальных материалах отдельно выделяют кодинг, онлайн-исследования, анализ данных, документы, таблицы и работу с разными инструментами. Что стало полезнее: Есть и цифры. В тесте Terminal-Bench 2.0 GPT-5.5 получил 82,7% против 75,1% у GPT-5.4. В GDPval, где оцениваются профессиональные рабочие задачи, показатель составил 84,9%. В OfficeQA Pro — 54,1%
Оглавление

Апрель стал месяцем, когда нейросети окончательно перестали быть просто «чатами для текста». Теперь они пишут код, ведут исследование, создают изображения, собирают отчеты, работают голосом, делают презентации и подключаются к рабочим сервисам. Разбираем, что обновилось у главных ИИ-платформ и какие фишки стоит попробовать уже сейчас.

Сгенерировано с ИИ
Сгенерировано с ИИ

Коротко: что изменилось

Главные игроки месяца — ChatGPT, DeepSeek, Gemini, Grok и Claude.

Если совсем кратко:

  • ChatGPT стал сильнее в сложной работе, коде, документах, таблицах и изображениях.
  • DeepSeek выпустил V4 Preview с контекстом до 1 млн токенов.
  • Gemini усилил исследовательские агенты, изображения, музыку, блокноты и голос.
  • Grok сделал большой шаг в голосовых агентах и распознавании речи.
  • Claude прокачал кодинг, дизайн, презентации и работу с визуальными материалами.

ChatGPT: больше не просто ответ, а готовая работа

Главное обновление ChatGPT — GPT-5.5. OpenAI называет модель самой сильной для профессиональной работы: она лучше понимает сложные цели, использует инструменты, проверяет результат и доводит многошаговые задачи до конца. В официальных материалах отдельно выделяют кодинг, онлайн-исследования, анализ данных, документы, таблицы и работу с разными инструментами.

Что стало полезнее:

  • можно давать неидеальный, «сырой» запрос и получать более собранный результат;
  • модель лучше держит контекст в больших задачах;
  • стала сильнее в работе с кодом и реальными задачами из репозиториев;
  • лучше подходит для отчетов, исследований, таблиц, презентаций и планов.

Есть и цифры. В тесте Terminal-Bench 2.0 GPT-5.5 получил 82,7% против 75,1% у GPT-5.4. В GDPval, где оцениваются профессиональные рабочие задачи, показатель составил 84,9%. В OfficeQA Pro — 54,1%, что особенно важно для тех, кто работает с офисными документами и корпоративными знаниями.

Еще одна заметная новинка — ChatGPT Images 2.0. Модель лучше работает с текстом на изображениях, многоязычными макетами, инфографикой, комиксами, постерами, рекламными материалами и визуальными объяснениями. Это уже не просто генератор красивых картинок, а инструмент для маркетологов, дизайнеров, преподавателей и авторов контента.

Для команд появились workspace agents — рабочие агенты, которые могут выполнять длинные процессы внутри компании с учетом прав доступа и настроек организации. Это шаг к ИИ, который не только отвечает, но и берет на себя повторяющиеся бизнес-задачи.

Полезная фишка: попробуйте давать ChatGPT не одну маленькую задачу, а весь процесс целиком: «собери данные, сделай выводы, оформи таблицу, предложи структуру поста и проверь слабые места». Новые модели лучше справляются именно с такими цепочками.

DeepSeek: длинный контекст и открытая модель

Главное обновление DeepSeek — DeepSeek-V4 Preview. Платформа заявила два варианта модели: V4-Pro и V4-Flash. V4-Pro имеет 1,6 трлн общих параметров и 49 млрд активных, а V4-Flash — 284 млрд общих и 13 млрд активных параметров. Оба варианта поддерживают контекст до 1 млн токенов.

Почему это важно? Контекст в 1 млн токенов позволяет загружать большие документы, длинные переписки, отчеты, кодовые базы и материалы проекта. Модель может анализировать не кусок, а почти всю рабочую картину.

Что нового:

  • режим Thinking и Non-Thinking, то есть можно выбирать глубокое рассуждение или быстрый ответ;
  • V4-Pro ориентирован на сложный кодинг, математику, рассуждения и агентные задачи;
  • V4-Flash сделан как более быстрый и экономичный вариант;
  • модель открыта и доступна через API;
  • старые deepseek-chat и deepseek-reasoner будут постепенно выведены из доступа.

Полезная фишка: DeepSeek особенно интересен тем, кто работает с большими текстами и кодом. Например, можно загрузить длинную техническую документацию и попросить модель найти противоречия, собрать краткое резюме, составить план доработок или объяснить архитектуру проекта.

Gemini: исследования, музыка, блокноты и умные визуалы

У Gemini в апреле было сразу несколько заметных обновлений. В Gemini Drop появились персонализированные изображения, подключение Google-приложений для более личных ответов, блокноты с NotebookLM, приложение для Mac, генерация музыки до 3 минут и интерактивные визуальные объяснения сложных тем.

Отдельно стоит выделить Deep Research и Deep Research Max. Это исследовательские агенты, построенные на Gemini 3.1 Pro. Они могут собирать данные из открытого веба, файлов, подключенных хранилищ и внешних источников через MCP — протокол подключения инструментов. Агент не просто пишет отчет, а строит план исследования, ищет источники, делает выводы и может создавать графики и инфографику.

Что полезно бизнесу и авторам:

  • можно собирать рыночные обзоры;
  • делать сравнительные таблицы по конкурентам;
  • готовить аналитические отчеты;
  • превращать данные в графики и презентационные материалы;
  • работать с PDF, CSV, изображениями, аудио и видео как с источниками.

Для разработчиков вышел Gemini 3.1 Flash TTS Preview — модель для генерации речи из текста. Google описывает ее как выразительную, управляемую и экономичную.

Еще одно важное обновление — Gemini Embedding 2. Это модель для поиска смысла в разных типах данных: тексте, изображениях, видео, аудио и PDF. Она поддерживает вход до 8192 токенов и размер вектора от 128 до 3072. Для бизнеса это основа для умного поиска по базе знаний, каталогу, архиву документов или медиатеке.

Полезная фишка: Gemini становится сильным инструментом для исследований. Его стоит пробовать не только для текстов, но и для задач вроде «сравни рынок», «найди закономерности», «собери отчет из документов» и «объясни сложную тему через схему».

Grok: голосовые агенты становятся серьезнее

У Grok главное обновление — Grok Voice Think Fast 1.0. Это голосовой агент для API, который рассчитан на сложные разговорные сценарии: поддержку клиентов, продажи, запись на услуги, бронирование, обработку данных и работу с несколькими инструментами одновременно.

xAI пишет, что модель тестировали на реальных условиях: телефонный звук, шум, акценты, перебивания и живой диалог. Также заявлена поддержка более 25 языков. В τ-voice Bench модель заняла первое место среди голосовых агентов в сценариях ритейла, авиаперевозок и телекома.

Еще одно обновление — Speech to Text API. Теперь Grok умеет распознавать речь в 25 языках, в пакетном и потоковом режимах. Это важно для сервисов, где нужно быстро переводить звонки, голосовые сообщения или интервью в текст.

Что можно делать:

  • голосового консультанта для сайта;
  • бота для записи клиентов;
  • помощника для кол-центра;
  • расшифровку звонков;
  • голосовой интерфейс для приложений.

Полезная фишка: Grok стоит смотреть тем, кто думает не только о тексте, но и о голосовом клиентском сервисе. Например, если бизнес принимает много звонков, голосовой агент может стать не игрушкой, а способом разгрузить администраторов.

Claude: код, дизайн и рабочие материалы

Claude получил сразу два сильных обновления: Claude Opus 4.7 и Claude Design.

Opus 4.7 стал прямым апгрейдом Opus 4.6. Anthropic отмечает улучшения в следовании инструкциям, мультимодальности, долгих задачах, памяти и работе с файлами. Модель принимает изображения до 2576 пикселей по длинной стороне, то есть примерно до 3,75 мегапикселя, что помогает читать сложные схемы, интерфейсы и технические материалы.

По тестам партнеров и ранних пользователей, Opus 4.7 заметно усилился в коде. Например, на 93-задачном coding benchmark результат вырос на 13% относительно Opus 4.6, а на CursorBench модель набрала 70% против 58% у Opus 4.6. Также Anthropic пишет о 21% меньшем числе ошибок в OfficeQA Pro при работе с документами.

Для разработчиков появились:

  • новый уровень усилия xhigh — между high и max;
  • task budgets — бюджеты задачи, чтобы управлять расходом токенов в длинных запусках;
  • команда /ultrareview в Claude Code для отдельной сессии ревью кода;
  • auto mode для более длинных задач с меньшим числом остановок.

Claude Design — отдельный продукт Anthropic Labs для визуальной работы. Он помогает создавать дизайны, прототипы, слайды, одностраничники, презентации, маркетинговые материалы и экспортировать результат в Canva, PDF, PPTX или HTML.

Полезная фишка: Claude сейчас особенно интересен тем, кто делает код, интерфейсы, презентации и прототипы. Можно описать идею продукта, получить каркас интерфейса, затем передать его в разработку через Claude Code.

Что это значит для обычного пользователя

Нейросети двигаются в сторону «сделай за меня процесс», а не «ответь на вопрос». Самые полезные навыки теперь такие:

  1. Уметь ставить задачу не одной фразой, а как рабочий процесс.
  2. Давать ИИ файлы, контекст, ограничения и критерии результата.
  3. Проверять выводы, источники и цифры.
  4. Использовать разные сервисы под разные задачи.
  5. Понимать, когда нужен быстрый ответ, а когда — глубокое рассуждение.

Что выбрать

  • Если нужно писать, анализировать, кодить, делать документы и изображения — начинайте с ChatGPT.
  • Если нужны большие документы, длинный контекст и открытая модель — смотрите DeepSeek.
  • Если нужны исследования, визуализация данных, работа с Google-сервисами и мультимодальность — полезен Gemini.
  • Если важен голос, звонки и разговорные агенты — тестируйте Grok.
  • Если вы работаете с кодом, интерфейсами, дизайном и презентациями — присмотритесь к Claude.

Главный вывод: одной «лучшей» нейросети уже нет. Есть набор инструментов, и выигрывает тот, кто умеет выбирать модель под задачу.

Где учиться работать с ИИ

ИИ быстро меняется: то, что было новым пару месяцев назад, уже становится базовым навыком. Поэтому важно не просто «пробовать нейросети», а учиться работать с ними системно: ставить задачи, проверять результат, автоматизировать рутину и применять ИИ в профессии.

Курс по ИИ-программированию (Вайб-кодинг) в Москве — AI-программирование от Академии ТОП
Искусственный интеллект для жизни: от первых шагов: от первых шагов к уверенным навыкам в Москве