Найти в Дзене
Заметки Dewiar AI

ИИ-революция недели: Claude побил все рекорды в кодинге, а Alibaba выпустила мультимодального монстра

Новые модели обходят GPT-5 в тестах, а нейросети научились создавать сами себя. Разбираем главные прорывы, которые изменят вашу работу с ИИ. Claude Sonnet 4.5: Новый король кода, который думает часами Anthropic выпустила обновление, которое заставит разработчиков забыть о GPT-5. Claude Sonnet 4.5 не просто улучшил показатели — он изменил правила игры. Что шокирует в новой модели: Личное тестирование: Кодинг действительно стал другим. Модель не просто генерирует код, она анализирует архитектуру, предлагает оптимизации и даже предугадывает edge-cases. Но главное что теперь это не просто модель, а целая экосистема для разработки: Claude Agent SDK где любой разработчик может создать собственного ИИ-агента с такими же возможностями, как у Claude Code
Память между сессиями - модель запоминает контекст проекта даже после перезагрузки
Контрольные точки - можно откатиться к предыдущим состояниям, если что-то пошло не так
Автосуммаризация - когда контекст переполняется, ИИ сам выделяет главное П
Оглавление

Новые модели обходят GPT-5 в тестах, а нейросети научились создавать сами себя. Разбираем главные прорывы, которые изменят вашу работу с ИИ.

Claude Sonnet 4.5: Новый король кода, который думает часами

Anthropic выпустила обновление, которое заставит разработчиков забыть о GPT-5. Claude Sonnet 4.5 не просто улучшил показатели — он изменил правила игры.

Что шокирует в новой модели:

  • 82% в SWE-bench побил рекорды всех существующих моделей в решении реальных coding-задач
  • Переменный бюджет "размышлений" может думать над сложными задачами до нескольких часов
  • 100% по математике с использованием Python-инструментов
  • 61.4% в OSWorld — абсолютный рекорд в компьютерном взаимодействии

Личное тестирование: Кодинг действительно стал другим. Модель не просто генерирует код, она анализирует архитектуру, предлагает оптимизации и даже предугадывает edge-cases.

Claude Code: Теперь с памятью и контрольными точками

Но главное что теперь это не просто модель, а целая экосистема для разработки:

Claude Agent SDK где любой разработчик может создать собственного ИИ-агента с такими же возможностями, как у Claude Code
Память между сессиями - модель запоминает контекст проекта даже после перезагрузки
Контрольные точки - можно откатиться к предыдущим состояниям, если что-то пошло не так
Автосуммаризация - когда контекст переполняется, ИИ сам выделяет главное

Почему это меняет всё? Теперь вы можете построить собственного ИИ-помощника, который будет знать вашу кодовую базу лучше вас.

Битва титанов: OpenAI и Meta бросают вызов TikTok

Пока Anthropic совершенствует разработчиков, другие гиганты борются за внимание обычных пользователей.

Sora 2 от OpenAI:

  • Бесконечная лента ИИ-видео как в TikTok
  • Можно создавать цифровых двойников
  • Уже возглавил топ App Store
  • Подписчики ChatGPT Pro получают видео в HD без ограничений

Vibes от Meta:

  • Генерация видео по изображениям
  • Ремиксы существующего контента
  • Интеграция с Instagram и Facebook

Личное мнение: Sora 2 дико затягивает. После 10 минут скроллинга начинаешь забывать, что всё вокруг ненастоящее.

ChatGPT учится шопиться и напоминать о важном

ChatGPT Pulse персональный ассистент, который:

  • Анализирует ваши чаты, почту и календарь
  • Напоминает о встречах за час
  • Предлагает новости по вашим интересам
  • Дает советы на основе вашей активности

Instant Checkout покупайте, не выходя из чата:

  • Интеграция с Etsy и Shopify
  • OpenAI получает комиссию с продаж
  • Обещают не влиять на рекомендации ради прибыли

Alibaba атакует: Мультимодальный монстр за копейки

Китайский гигант выпустил три модели, которые могут изменить рынок:

Qwen3-Max (1 триллион параметров):

  • Стоит в 2 раза дешевле GPT-5
  • Обходит Anthropic и DeepSeek в тестах
  • Закрытые веса — только через API

Qwen3-VL-235B (открытая):

  • Лучшая в мире по пониманию документов
  • Рекорды в 2D/3D анализе пространства
  • $0.70 за 1 млн токенов — смешные деньги

Qwen3-Omni-30B (мультимодальная):

  • Понимает текст, изображения, видео и аудио
  • Лучшая открытая модель для голосовых приложений
  • Обходит GPT-4o в 22 из 36 аудио-тестов

Почему это важно: Впервые открытые модели превосходят закрытые в ключевых задачах.

Text-to-LoRA: Нейросеть, которая создает другие нейросети

Самый технологичный прорыв недели - модель, генерирующая адаптеры для других моделей:

  • Обучается на описании задачи текстом
  • Создает кастомные LoRA-адаптеры за секунды
  • Работает с задачами, которых не было в тренировочных данных
  • Экономит 90% времени на тонкой настройке

Пример использования:
Описание: "Нужен адаптер для анализа медицинских исследований с акцентом на статистическую значимость"
Результат: Готовый адаптер, который превращает обычную модель в медицинского эксперта

Что это значит для вас?

Для разработчиков:

  • Claude Sonnet 4.5 + Claude Code = новая эра разработки
  • Qwen3-VL — лучший выбор для бюджетных мультимодальных проектов
  • Text-to-LoRA ускорит кастомизацию моделей в 10 раз

Для бизнеса:

  • Sora 2 и Vibes открывают новые возможности для маркетинга
  • ChatGPT Pulse может заменить личных ассистентов
  • Instant Checkout — новый канал для e-commerce

Для обычных пользователей:

  • ИИ становится персональным помощником, а не просто игрушкой
  • Видео с вашим цифровым двойником скоро станут нормой
  • Покупки через чат сэкономят часы времени

Наш опыт: Почему Claude 4.5 — это новый стандарт

После недели тестирования я понял: это не просто очередное обновление. Claude действительно научился думать, а не просто генерировать текст.

Особенно впечатлило в кодинге:

  • Понимание legacy-кода без дополнительных объяснений
  • Предложения по рефакторингу, которые действительно имеют смысл
  • Способность работать с огромной кодовой базой без потери контекста

Вывод: Если вы еще не пробовали новые инструменты — самое время начать. Разрыв между лидерами и аутсайдерами становится критическим.

А вы уже тестировали новые модели? Какие впечатления?