1868 подписчиков

Все главные обновления нейросетей за апрель: ChatGPT, DeepSeek, Gemini, Grok и Claude

30 апреля30 апр

7 мин

Апрель стал месяцем, когда нейросети окончательно перестали быть просто «чатами для текста». Теперь они пишут код, ведут исследование, создают изображения, собирают отчеты, работают голосом, делают презентации и подключаются к рабочим сервисам. Разбираем, что обновилось у главных ИИ-платформ и какие фишки стоит попробовать уже сейчас. Главные игроки месяца — ChatGPT, DeepSeek, Gemini, Grok и Claude. Если совсем кратко: Главное обновление ChatGPT — GPT-5.5. OpenAI называет модель самой сильной для профессиональной работы: она лучше понимает сложные цели, использует инструменты, проверяет результат и доводит многошаговые задачи до конца. В официальных материалах отдельно выделяют кодинг, онлайн-исследования, анализ данных, документы, таблицы и работу с разными инструментами. Что стало полезнее: Есть и цифры. В тесте Terminal-Bench 2.0 GPT-5.5 получил 82,7% против 75,1% у GPT-5.4. В GDPval, где оцениваются профессиональные рабочие задачи, показатель составил 84,9%. В OfficeQA Pro — 54,1%

Оглавление

Коротко: что изменилось
ChatGPT: больше не просто ответ, а готовая работа
DeepSeek: длинный контекст и открытая модель

Коротко: что изменилось

Главные игроки месяца — ChatGPT, DeepSeek, Gemini, Grok и Claude.

Если совсем кратко:

ChatGPT стал сильнее в сложной работе, коде, документах, таблицах и изображениях.
DeepSeek выпустил V4 Preview с контекстом до 1 млн токенов.
Gemini усилил исследовательские агенты, изображения, музыку, блокноты и голос.
Grok сделал большой шаг в голосовых агентах и распознавании речи.
Claude прокачал кодинг, дизайн, презентации и работу с визуальными материалами.

ChatGPT: больше не просто ответ, а готовая работа

Главное обновление ChatGPT — GPT-5.5. OpenAI называет модель самой сильной для профессиональной работы: она лучше понимает сложные цели, использует инструменты, проверяет результат и доводит многошаговые задачи до конца. В официальных материалах отдельно выделяют кодинг, онлайн-исследования, анализ данных, документы, таблицы и работу с разными инструментами.

Что стало полезнее:

можно давать неидеальный, «сырой» запрос и получать более собранный результат;
модель лучше держит контекст в больших задачах;
стала сильнее в работе с кодом и реальными задачами из репозиториев;
лучше подходит для отчетов, исследований, таблиц, презентаций и планов.

Есть и цифры. В тесте Terminal-Bench 2.0 GPT-5.5 получил 82,7% против 75,1% у GPT-5.4. В GDPval, где оцениваются профессиональные рабочие задачи, показатель составил 84,9%. В OfficeQA Pro — 54,1%, что особенно важно для тех, кто работает с офисными документами и корпоративными знаниями.

Еще одна заметная новинка — ChatGPT Images 2.0. Модель лучше работает с текстом на изображениях, многоязычными макетами, инфографикой, комиксами, постерами, рекламными материалами и визуальными объяснениями. Это уже не просто генератор красивых картинок, а инструмент для маркетологов, дизайнеров, преподавателей и авторов контента.

Для команд появились workspace agents — рабочие агенты, которые могут выполнять длинные процессы внутри компании с учетом прав доступа и настроек организации. Это шаг к ИИ, который не только отвечает, но и берет на себя повторяющиеся бизнес-задачи.

Полезная фишка: попробуйте давать ChatGPT не одну маленькую задачу, а весь процесс целиком: «собери данные, сделай выводы, оформи таблицу, предложи структуру поста и проверь слабые места». Новые модели лучше справляются именно с такими цепочками.

DeepSeek: длинный контекст и открытая модель

Главное обновление DeepSeek — DeepSeek-V4 Preview. Платформа заявила два варианта модели: V4-Pro и V4-Flash. V4-Pro имеет 1,6 трлн общих параметров и 49 млрд активных, а V4-Flash — 284 млрд общих и 13 млрд активных параметров. Оба варианта поддерживают контекст до 1 млн токенов.

Почему это важно? Контекст в 1 млн токенов позволяет загружать большие документы, длинные переписки, отчеты, кодовые базы и материалы проекта. Модель может анализировать не кусок, а почти всю рабочую картину.

Что нового:

режим Thinking и Non-Thinking, то есть можно выбирать глубокое рассуждение или быстрый ответ;
V4-Pro ориентирован на сложный кодинг, математику, рассуждения и агентные задачи;
V4-Flash сделан как более быстрый и экономичный вариант;
модель открыта и доступна через API;
старые deepseek-chat и deepseek-reasoner будут постепенно выведены из доступа.

Полезная фишка: DeepSeek особенно интересен тем, кто работает с большими текстами и кодом. Например, можно загрузить длинную техническую документацию и попросить модель найти противоречия, собрать краткое резюме, составить план доработок или объяснить архитектуру проекта.

Gemini: исследования, музыка, блокноты и умные визуалы

У Gemini в апреле было сразу несколько заметных обновлений. В Gemini Drop появились персонализированные изображения, подключение Google-приложений для более личных ответов, блокноты с NotebookLM, приложение для Mac, генерация музыки до 3 минут и интерактивные визуальные объяснения сложных тем.

Отдельно стоит выделить Deep Research и Deep Research Max. Это исследовательские агенты, построенные на Gemini 3.1 Pro. Они могут собирать данные из открытого веба, файлов, подключенных хранилищ и внешних источников через MCP — протокол подключения инструментов. Агент не просто пишет отчет, а строит план исследования, ищет источники, делает выводы и может создавать графики и инфографику.

Что полезно бизнесу и авторам:

можно собирать рыночные обзоры;
делать сравнительные таблицы по конкурентам;
готовить аналитические отчеты;
превращать данные в графики и презентационные материалы;
работать с PDF, CSV, изображениями, аудио и видео как с источниками.

Для разработчиков вышел Gemini 3.1 Flash TTS Preview — модель для генерации речи из текста. Google описывает ее как выразительную, управляемую и экономичную.

Еще одно важное обновление — Gemini Embedding 2. Это модель для поиска смысла в разных типах данных: тексте, изображениях, видео, аудио и PDF. Она поддерживает вход до 8192 токенов и размер вектора от 128 до 3072. Для бизнеса это основа для умного поиска по базе знаний, каталогу, архиву документов или медиатеке.

Полезная фишка: Gemini становится сильным инструментом для исследований. Его стоит пробовать не только для текстов, но и для задач вроде «сравни рынок», «найди закономерности», «собери отчет из документов» и «объясни сложную тему через схему».

Grok: голосовые агенты становятся серьезнее

У Grok главное обновление — Grok Voice Think Fast 1.0. Это голосовой агент для API, который рассчитан на сложные разговорные сценарии: поддержку клиентов, продажи, запись на услуги, бронирование, обработку данных и работу с несколькими инструментами одновременно.

xAI пишет, что модель тестировали на реальных условиях: телефонный звук, шум, акценты, перебивания и живой диалог. Также заявлена поддержка более 25 языков. В τ-voice Bench модель заняла первое место среди голосовых агентов в сценариях ритейла, авиаперевозок и телекома.

Еще одно обновление — Speech to Text API. Теперь Grok умеет распознавать речь в 25 языках, в пакетном и потоковом режимах. Это важно для сервисов, где нужно быстро переводить звонки, голосовые сообщения или интервью в текст.

Что можно делать:

голосового консультанта для сайта;
бота для записи клиентов;
помощника для кол-центра;
расшифровку звонков;
голосовой интерфейс для приложений.

Полезная фишка: Grok стоит смотреть тем, кто думает не только о тексте, но и о голосовом клиентском сервисе. Например, если бизнес принимает много звонков, голосовой агент может стать не игрушкой, а способом разгрузить администраторов.

Claude: код, дизайн и рабочие материалы

Claude получил сразу два сильных обновления: Claude Opus 4.7 и Claude Design.

Opus 4.7 стал прямым апгрейдом Opus 4.6. Anthropic отмечает улучшения в следовании инструкциям, мультимодальности, долгих задачах, памяти и работе с файлами. Модель принимает изображения до 2576 пикселей по длинной стороне, то есть примерно до 3,75 мегапикселя, что помогает читать сложные схемы, интерфейсы и технические материалы.

По тестам партнеров и ранних пользователей, Opus 4.7 заметно усилился в коде. Например, на 93-задачном coding benchmark результат вырос на 13% относительно Opus 4.6, а на CursorBench модель набрала 70% против 58% у Opus 4.6. Также Anthropic пишет о 21% меньшем числе ошибок в OfficeQA Pro при работе с документами.

Для разработчиков появились:

новый уровень усилия xhigh — между high и max;
task budgets — бюджеты задачи, чтобы управлять расходом токенов в длинных запусках;
команда /ultrareview в Claude Code для отдельной сессии ревью кода;
auto mode для более длинных задач с меньшим числом остановок.

Claude Design — отдельный продукт Anthropic Labs для визуальной работы. Он помогает создавать дизайны, прототипы, слайды, одностраничники, презентации, маркетинговые материалы и экспортировать результат в Canva, PDF, PPTX или HTML.

Полезная фишка: Claude сейчас особенно интересен тем, кто делает код, интерфейсы, презентации и прототипы. Можно описать идею продукта, получить каркас интерфейса, затем передать его в разработку через Claude Code.

Что это значит для обычного пользователя

Нейросети двигаются в сторону «сделай за меня процесс», а не «ответь на вопрос». Самые полезные навыки теперь такие:

Уметь ставить задачу не одной фразой, а как рабочий процесс.
Давать ИИ файлы, контекст, ограничения и критерии результата.
Проверять выводы, источники и цифры.
Использовать разные сервисы под разные задачи.
Понимать, когда нужен быстрый ответ, а когда — глубокое рассуждение.

Что выбрать

Если нужно писать, анализировать, кодить, делать документы и изображения — начинайте с ChatGPT.
Если нужны большие документы, длинный контекст и открытая модель — смотрите DeepSeek.
Если нужны исследования, визуализация данных, работа с Google-сервисами и мультимодальность — полезен Gemini.
Если важен голос, звонки и разговорные агенты — тестируйте Grok.
Если вы работаете с кодом, интерфейсами, дизайном и презентациями — присмотритесь к Claude.

Главный вывод: одной «лучшей» нейросети уже нет. Есть набор инструментов, и выигрывает тот, кто умеет выбирать модель под задачу.

Где учиться работать с ИИ

ИИ быстро меняется: то, что было новым пару месяцев назад, уже становится базовым навыком. Поэтому важно не просто «пробовать нейросети», а учиться работать с ними системно: ставить задачи, проверять результат, автоматизировать рутину и применять ИИ в профессии.

msk.top-academy.ru

Курс по ИИ-программированию (Вайб-кодинг) в Москве — AI-программирование от Академии ТОП

msk.top-academy.ru

Искусственный интеллект для жизни: от первых шагов: от первых шагов к уверенным навыкам в Москве

Гаджеты и электроника

5,73 млн интересуются