14 подписчиков

ИИ-революция недели: Claude побил все рекорды в кодинге, а Alibaba выпустила мультимодального монстра

17 октября 202517 окт 2025

3 мин

Новые модели обходят GPT-5 в тестах, а нейросети научились создавать сами себя. Разбираем главные прорывы, которые изменят вашу работу с ИИ. Claude Sonnet 4.5: Новый король кода, который думает часами Anthropic выпустила обновление, которое заставит разработчиков забыть о GPT-5. Claude Sonnet 4.5 не просто улучшил показатели — он изменил правила игры. Что шокирует в новой модели: Личное тестирование: Кодинг действительно стал другим. Модель не просто генерирует код, она анализирует архитектуру, предлагает оптимизации и даже предугадывает edge-cases. Но главное что теперь это не просто модель, а целая экосистема для разработки: Claude Agent SDK где любой разработчик может создать собственного ИИ-агента с такими же возможностями, как у Claude Code

Память между сессиями - модель запоминает контекст проекта даже после перезагрузки

Контрольные точки - можно откатиться к предыдущим состояниям, если что-то пошло не так

Автосуммаризация - когда контекст переполняется, ИИ сам выделяет главное П

Память между сессиями - модель запоминает контекст проекта даже после перезагрузки

Контрольные точки - можно откатиться к предыдущим состояниям, если что-то пошло не так

Автосуммаризация - когда контекст переполняется, ИИ сам выделяет главное П

Оглавление

Claude Code: Теперь с памятью и контрольными точками
Битва титанов: OpenAI и Meta бросают вызов TikTok
ChatGPT учится шопиться и напоминать о важном

Новые модели обходят GPT-5 в тестах, а нейросети научились создавать сами себя. Разбираем главные прорывы, которые изменят вашу работу с ИИ.

Claude Sonnet 4.5: Новый король кода, который думает часами

Anthropic выпустила обновление, которое заставит разработчиков забыть о GPT-5. Claude Sonnet 4.5 не просто улучшил показатели — он изменил правила игры.

Что шокирует в новой модели:

82% в SWE-bench побил рекорды всех существующих моделей в решении реальных coding-задач
Переменный бюджет "размышлений" может думать над сложными задачами до нескольких часов
100% по математике с использованием Python-инструментов
61.4% в OSWorld — абсолютный рекорд в компьютерном взаимодействии

Личное тестирование: Кодинг действительно стал другим. Модель не просто генерирует код, она анализирует архитектуру, предлагает оптимизации и даже предугадывает edge-cases.

Claude Code: Теперь с памятью и контрольными точками

Но главное что теперь это не просто модель, а целая экосистема для разработки:

Claude Agent SDK где любой разработчик может создать собственного ИИ-агента с такими же возможностями, как у Claude Code
Память между сессиями - модель запоминает контекст проекта даже после перезагрузки
Контрольные точки - можно откатиться к предыдущим состояниям, если что-то пошло не так
Автосуммаризация - когда контекст переполняется, ИИ сам выделяет главное

Почему это меняет всё? Теперь вы можете построить собственного ИИ-помощника, который будет знать вашу кодовую базу лучше вас.

Битва титанов: OpenAI и Meta бросают вызов TikTok

Пока Anthropic совершенствует разработчиков, другие гиганты борются за внимание обычных пользователей.

Sora 2 от OpenAI:

Бесконечная лента ИИ-видео как в TikTok
Можно создавать цифровых двойников
Уже возглавил топ App Store
Подписчики ChatGPT Pro получают видео в HD без ограничений

Vibes от Meta:

Генерация видео по изображениям
Ремиксы существующего контента
Интеграция с Instagram и Facebook

Личное мнение: Sora 2 дико затягивает. После 10 минут скроллинга начинаешь забывать, что всё вокруг ненастоящее.

ChatGPT учится шопиться и напоминать о важном

ChatGPT Pulse персональный ассистент, который:

Анализирует ваши чаты, почту и календарь
Напоминает о встречах за час
Предлагает новости по вашим интересам
Дает советы на основе вашей активности

Instant Checkout покупайте, не выходя из чата:

Интеграция с Etsy и Shopify
OpenAI получает комиссию с продаж
Обещают не влиять на рекомендации ради прибыли

Alibaba атакует: Мультимодальный монстр за копейки

Китайский гигант выпустил три модели, которые могут изменить рынок:

Qwen3-Max (1 триллион параметров):

Стоит в 2 раза дешевле GPT-5
Обходит Anthropic и DeepSeek в тестах
Закрытые веса — только через API

Qwen3-VL-235B (открытая):

Лучшая в мире по пониманию документов
Рекорды в 2D/3D анализе пространства
$0.70 за 1 млн токенов — смешные деньги

Qwen3-Omni-30B (мультимодальная):

Понимает текст, изображения, видео и аудио
Лучшая открытая модель для голосовых приложений
Обходит GPT-4o в 22 из 36 аудио-тестов

Почему это важно: Впервые открытые модели превосходят закрытые в ключевых задачах.

Text-to-LoRA: Нейросеть, которая создает другие нейросети

Самый технологичный прорыв недели - модель, генерирующая адаптеры для других моделей:

Обучается на описании задачи текстом
Создает кастомные LoRA-адаптеры за секунды
Работает с задачами, которых не было в тренировочных данных
Экономит 90% времени на тонкой настройке

Пример использования:
Описание: "Нужен адаптер для анализа медицинских исследований с акцентом на статистическую значимость"
Результат: Готовый адаптер, который превращает обычную модель в медицинского эксперта

Что это значит для вас?

Для разработчиков:

Claude Sonnet 4.5 + Claude Code = новая эра разработки
Qwen3-VL — лучший выбор для бюджетных мультимодальных проектов
Text-to-LoRA ускорит кастомизацию моделей в 10 раз

Для бизнеса:

Sora 2 и Vibes открывают новые возможности для маркетинга
ChatGPT Pulse может заменить личных ассистентов
Instant Checkout — новый канал для e-commerce

Для обычных пользователей:

ИИ становится персональным помощником, а не просто игрушкой
Видео с вашим цифровым двойником скоро станут нормой
Покупки через чат сэкономят часы времени

Наш опыт: Почему Claude 4.5 — это новый стандарт

После недели тестирования я понял: это не просто очередное обновление. Claude действительно научился думать, а не просто генерировать текст.

Особенно впечатлило в кодинге:

Понимание legacy-кода без дополнительных объяснений
Предложения по рефакторингу, которые действительно имеют смысл
Способность работать с огромной кодовой базой без потери контекста

Вывод: Если вы еще не пробовали новые инструменты — самое время начать. Разрыв между лидерами и аутсайдерами становится критическим.

А вы уже тестировали новые модели? Какие впечатления?