Добавить в корзинуПозвонить
Найти в Дзене

📰 Liquid AI выпустила крошку LFM2.5-230M: маленькая модель, которая обходит гигантов в извлечении данных — Liquid AI новости

Когда команда бывших выпускников MIT запускает очередную языковую модель, обычно ждёшь чего-то монструозного на триллионах параметров. Но Liquid AI пошли другим путём и сегодня выпустили свою крошку — LFM2.5-230M. И, знаете, корпорациям стоит присмотреться к этому малышу для извлечения данных и локального развёртывания на смартфонах, ноутбуках и роботах. Это фундаментальная модель на 230 миллионов параметров, заточенная под агентные сценарии на устройстве. Как пишет сама Liquid в релизном посте, такой размер позволяет запускать её практически «где угодно». По заявлениям компании, она ещё и обходит модели, которые в четыре раза больше — на избранных бенчмарках. Конкретно: вытаскивает данные лучше, чем Alibaba Qwen3.5-0.8B (Instruct) с 800 миллионами параметров и Google Gemma 3 1B с миллиардом параметров. Модель нацелена на разработчиков и инженеров, которые строят лёгкие пайплайны для извлечения данных и автономные edge-системы. Распространяется по двойной коммерческой лицензии: физик

 📰 Liquid AI выпустила крошку LFM2.5-230M: маленькая модель, которая обходит гигантов в извлечении данных — Liquid AI новости

Когда команда бывших выпускников MIT запускает очередную языковую модель, обычно ждёшь чего-то монструозного на триллионах параметров. Но Liquid AI пошли другим путём и сегодня выпустили свою крошку — LFM2.5-230M. И, знаете, корпорациям стоит присмотреться к этому малышу для извлечения данных и локального развёртывания на смартфонах, ноутбуках и роботах.

Это фундаментальная модель на 230 миллионов параметров, заточенная под агентные сценарии на устройстве. Как пишет сама Liquid в релизном посте, такой размер позволяет запускать её практически «где угодно». По заявлениям компании, она ещё и обходит модели, которые в четыре раза больше — на избранных бенчмарках. Конкретно: вытаскивает данные лучше, чем Alibaba Qwen3.5-0.8B (Instruct) с 800 миллионами параметров и Google Gemma 3 1B с миллиардом параметров.

Модель нацелена на разработчиков и инженеров, которые строят лёгкие пайплайны для извлечения данных и автономные edge-системы. Распространяется по двойной коммерческой лицензии: физикам и компаниям с годовой выручкой меньше 10 миллионов долларов модель достаётся бесплатно, а крупным корпорациям — за отдельный платный договор. Этот релиз отличается от других маленьких AI-моделей тем, что использует архитектуру LFM2 для высокой скорости инференса без гигантского расхода памяти, типичного для трансформеров с кучей параметров.

Пока гиганты вроде Anthropic, OpenAI, Google, Microsoft и Meta гонятся за сотнями миллиардов и триллионами параметров, чтобы выжать frontier-производительность, параллельная гонка целиком сосредоточена на edge и локальных развёртываниях. Запуск Liquid AI модели LFM2.5-230M сигнализирует о повороте в сторону архитектурной эффективности вместо brute-force масштабирования. Втиснув 19 триллионов токенов предобучения в модель на 230 миллионов параметров, компания доказала: edge-устройствам не нужна бешеная вычислительная мощность или постоянное облачное соединение для сложных многошаговых агентных сценариев.

Как работает LFM2.5-230M

Модель LFM2.5-230M отходит от стандартных трансформерных архитектур, опираясь на фреймворк LFM2. Эта архитектура работает как гибридная система: перемежает управляемые короткие свёртки с grouped-query attention для эффективной обработки информации. Для тех, кто следит за эволюцией эффективных архитектур, подход Liquid преследует схожую концептуальную цель: управлять длинными контекстами и последовательными данными на edge-железе без квадратичных затрат памяти чистых механизмов внимания. Модель поддерживает окно контекста в 32K токенов — достаточно, чтобы проглотить объёмные документы или непрерывные потоки телеметрии с роботов.

Если глянуть на графики производительности в релизе, архитектурная эффективность видна невооружённым глазом. Модель укладывается в footprint менее 400 МБ, при этом выдает скорости префилла и декодинга, которые опережают конкурентов вроде Gemma 3 1B IT и Granite 4.0-H-350M. На Samsung Galaxy S25 Ultra с процессором Qualcomm Snapdragon Gen4 модель достигает 213 токенов в секунду на декодинге. Даже на сильно ограниченном Raspberry Pi 5 декодинг держит 42 токена в секунду. Кроме того, внутренние бенчмарки показывают, что GPU-стек вывода даёт меньшую end-to-end задержку, чем конкурирующие маленькие модели на всех уровнях параллелизма....

🔗 Полный текст статьи читайте у нас на сайте: Читать на TechLoot

📢 ТехноЛут