В минувшее воскресенье девять исследователей из Sina Weibo — китайской соцсети, которая известна микроблогами, а не передовым ИИ, — тихо выложили на arXiv 14-страничный техотчёт, взорвавший AI-сообщество. Их заявление: языковая модель с всего 3 миллиардами параметров может на равных соперничать по логическим рассуждениям с флагманскими системами Google DeepMind, OpenAI, Anthropic и DeepSeek, которые в сотни раз больше. Модель, названная VibeThinker-3B, набрала 94.3 на AIME 2026 — Американской пригласительной математической олимпиаде, одном из самых сложных стандартизированных конкурсов по математике в мире. Этот результат ставит её рядом с DeepSeek V3.2 (671 млрд параметров) и выше Gemini 3 Pro (91.7) от Google. При использовании техники масштабирования на этапе тестирования, которую команда называет Claim-Level Reliability Assessment, показатель взлетает до 97.1, обходя практически все известные системы. В течение нескольких часов после публикации статья набрала 62 апвоута на Huggin
📰 VibeThinker-3B от Sina Weibo: крошечная модель с 3 млрд параметров ломает шаблоны и заставляет пересмотреть ai benchmark — TechLoot
СегодняСегодня
2 мин