Команда Пекинского университета представила Fairy2i — универсальный фреймворк, позволяющий сжимать большие языковые модели до 2 бит на параметр без существенной потери точности. Это открывает путь к запуску современных ИИ даже на смартфонах и других маломощных устройствах. В чём суть Fairy2i? Главная инновация — преобразование обычных (реальных) весов модели в комплексные (с использованием мнимых чисел), что позволяет использовать более плотное и информативное 2-битное кодирование. Вместо традиционного подхода, требующего полного переобучения модели, Fairy2i позволяет напрямую конвертировать уже готовые веса (например, LLaMA) в новый формат — быстро, без потери исходной точности. Ключевые технологии: Генерализация весов: любой слой с чётным числом параметров можно без потерь переписать в комплексной форме, что даёт старт для дальнейшей эффективной квантования. Фазовая 2-битная квантование: используются четыре комплексных значения {+1, -1, +i, -i}, что обеспеч
Fairy2i: революция в сжатии ИИ — 2-битные модели почти без потери качества
10 декабря 202510 дек 2025
2 мин