Вышел ежегодный отчет от Стэнфорда об AI. Читать 400 страниц не нужно, вот самые важные факты оттуда 👇 💻 Многие бенчмарки по программированию пробиты Метрика SWE-bench Verified, оценивающая способность решать реальные issue на GitHub, взлетела с 60% до почти 100% всего за один год. Тесты, рассчитанные на годы, сатурируются за месяцы. В Terminal-Bench (работа агента в реальной консоли: от компиляции до поднятия серверов) точность выросла с 20% до 77.3%. 🗑 Интернет мертв, синтетика не спасает С января 2025 года >50% нового контента в интернете сгенерировано ИИ. При этом обучать LLM чисто на синтетике до сих пор не выходит — качество не растет. Вся магия сейчас в data-centric подходе. Модель OLMo 3.1 Think 32B показывает результаты на уровне Grok 4, имея в 90 раз меньше параметров. Секрет: жесткий прунинг, дедупликация и курация обучающей выборки, а не бездумное наращивание весов. ⚔️ Конец американской монополии и эпоха закрытости Технологический разрыв между США и Китаем фактическ
Стэнфордский AI Index Report 2026: бенчмарки пробиты, агенты наступают, джунов вымывает с рынка
12 мая12 мая
3
2 мин