Найти в Дзене
Нейрозона сегодня

Маленькая, но мощная: новая модель ИИ превзошла гигантов

Компактная модель с открытым исходным кодом, содержащая всего 2,6 млрд параметров, продемонстрировала выдающуюся производительность в ключевых тестах, превзойдя значительно более крупную DeepSeek R1-0528 и заслуженно получила звание самой мощной модели в категории 3 млрд параметров. В ходе сравнительных испытаний модель показала впечатляющие результаты: значительное превосходство над конкурентами в тесте на выполнение инструкций IFBench, около 42% в сложном тесте знаний GPQA, более 88% в строгом тесте на следование инструкциям IFEval и более 82% в математическом тесте GSM8K, обойдя многие более крупные модели. Модель отличается вдвое более высокой скоростью работы на процессоре и минимальным потреблением памяти. Архитектура LFM2, сочетающая свертку и механизм внимания, оптимизирована для локального развертывания на смартфонах, ноутбуках и IoT-устройствах, воплощая в себе идею «логики уровня PhD в кармане». Оптимизация архитектуры для периферийных устройств реализована с использованием

Компактная модель с открытым исходным кодом, содержащая всего 2,6 млрд параметров, продемонстрировала выдающуюся производительность в ключевых тестах, превзойдя значительно более крупную DeepSeek R1-0528 и заслуженно получила звание самой мощной модели в категории 3 млрд параметров.

В ходе сравнительных испытаний модель показала впечатляющие результаты: значительное превосходство над конкурентами в тесте на выполнение инструкций IFBench, около 42% в сложном тесте знаний GPQA, более 88% в строгом тесте на следование инструкциям IFEval и более 82% в математическом тесте GSM8K, обойдя многие более крупные модели.

Модель отличается вдвое более высокой скоростью работы на процессоре и минимальным потреблением памяти. Архитектура LFM2, сочетающая свертку и механизм внимания, оптимизирована для локального развертывания на смартфонах, ноутбуках и IoT-устройствах, воплощая в себе идею «логики уровня PhD в кармане».

Оптимизация архитектуры для периферийных устройств реализована с использованием метода «чистого RL» без классического SFT. Веса модели доступны на Hugging Face.

Полная открытость модели на Hugging Face способствует демократизации периферийного ИИ, предоставляя разработчикам свободу внедрения в свои приложения. Релиз LFM2-2.6B-Exp подтверждает, что высокая интеллектуальная производительность достигается не только масштабированием параметров, но и передовыми методами обучения.

Это открывает новые возможности для разработчиков и компаний, которым важны конфиденциальность данных, низкая задержка и доступная стоимость развёртывания интеллектуальных систем.