🚀 Парадигма меняется: локальные модели выходят на новый уровень Polaris — это набор простых, но мощных приёмов, который позволяет даже компактным LLM (4 B, 7 B) догнать и превзойти «тяжеловесов» на задачах рассуждения (открытая 4B модель превосходи Claude-4-Opus). Вот как это работает и почему важно: • Управление сложностью данных – Генерируем несколько (например, 8) вариантов решения от базовой модели – Оцениваем, какие примеры слишком простые (8/8) или слишком сложные (0/8), и убираем их – Оставляем «умеренные» задачи с правильными решениями в 20–80 % случаев, чтобы быть ни слишком лёгкими, ни слишком сложными • Разнообразие «прогонов» (rollout-ов) – Мы запускаем модель несколько раз на одной и той же задаче и смотрим, как меняются её рассуждения: одни и те же входные данные, но разные «пути» к решению. – Считаем, насколько разнообразны эти пути (т. е. их «энтропия»): если модели всё время идут по одной линии, новых идей не появляется; если слишком хаотично — рассуждения неустойч
🚀 Парадигма меняется: локальные модели выходят на новый уровень
23 июня 202523 июн 2025
54
2 мин