Найти в Дзене
Максим Кульгин

Смотрите, что нашли - команда выпустила VibeThinker, модельку всего 1.5B параметров, которая якобы обгоняет большие модели в математике и

Смотрите, что нашли - команда выпустила VibeThinker, модельку всего 1.5B параметров, которая якобы обгоняет большие модели в математике и программировании. Но в комментах такой срач... Одни кричат "прорыв!", другие - "опять бенчмарки натренировали". Самые адекватные пишут: "ребята, просто попробуйте сами". А еще разработчики честно признаются - это исследовательский проект, а не готовый продукт. Модель переобучается, контекст теряет, но для своих 1.5B - просто огонь. Особенно смешно, что она все ответы в \boxed{} заворачивает, как на матолимпиадах. И главный вопрос - где грань между настоящим reasoning и натаскиванием на тесты? Вот все эти мелкие модели показывают крутые цифры в бенчмарках, а на практике... Ну вы поняли. Русский ИТ бизнес

Смотрите, что нашли - команда выпустила VibeThinker, модельку всего 1.5B параметров, которая якобы обгоняет большие модели в математике и программировании. Но в комментах такой срач...

Одни кричат "прорыв!", другие - "опять бенчмарки натренировали". Самые адекватные пишут: "ребята, просто попробуйте сами".

А еще разработчики честно признаются - это исследовательский проект, а не готовый продукт. Модель переобучается, контекст теряет, но для своих 1.5B - просто огонь. Особенно смешно, что она все ответы в \boxed{} заворачивает, как на матолимпиадах.

И главный вопрос - где грань между настоящим reasoning и натаскиванием на тесты? Вот все эти мелкие модели показывают крутые цифры в бенчмарках, а на практике... Ну вы поняли.

Русский ИТ бизнес