Найти в Дзене
ДАТАВЕСТИ

Microsoft представила ИИ, которому не нужен суперкомпьютер.

Пока индустрия искусственного интеллекта соревнуется в наращивании параметров и мегабайт, исследователи из Microsoft выбрали совершенно иной путь — сделать мощную ИИ-модель, которая спокойно работает на обычном процессоре. Да-да, без видеокарты. Встречайте: BitNet b1.58 2B4T — компактная, умная и невероятно экономичная. BitNet b1.58 2B4T на бумаге выглядит довольно скромно: всего 2 миллиарда параметров. Но за этой цифрой скрывается настоящее инженерное волшебство. Модель прошла обучение на 4 триллионах токенов — это примерно столько же, сколько содержится в 33 миллионах книг. То есть знаний в ней — с избытком. Однако главное — не масштаб, а эффективность. BitNet не просто работает на центральном процессоре (CPU), а делает это быстрее и с меньшим потреблением памяти, чем многие её более крупные собратья. И это при том, что она обгоняет конкурентов от Meta, Google и Alibaba в ряде тестов, включая решение задач по математике и физике на уровне школьной программы. Всё дело в архитектуре. В
Оглавление

Пока индустрия искусственного интеллекта соревнуется в наращивании параметров и мегабайт, исследователи из Microsoft выбрали совершенно иной путь — сделать мощную ИИ-модель, которая спокойно работает на обычном процессоре. Да-да, без видеокарты. Встречайте: BitNet b1.58 2B4T — компактная, умная и невероятно экономичная.

Умная — не значит тяжёлая.

BitNet b1.58 2B4T на бумаге выглядит довольно скромно: всего 2 миллиарда параметров. Но за этой цифрой скрывается настоящее инженерное волшебство. Модель прошла обучение на 4 триллионах токенов — это примерно столько же, сколько содержится в 33 миллионах книг. То есть знаний в ней — с избытком.

Однако главное — не масштаб, а эффективность. BitNet не просто работает на центральном процессоре (CPU), а делает это быстрее и с меньшим потреблением памяти, чем многие её более крупные собратья. И это при том, что она обгоняет конкурентов от Meta, Google и Alibaba в ряде тестов, включая решение задач по математике и физике на уровне школьной программы.

Как это работает?

Всё дело в архитектуре. В Microsoft решили не использовать привычный 16-битный или 8-битный формат. Вместо этого они разработали однобитную языковую модель, которую обучили и оптимизировали так, чтобы она работала шустро и без "аппетита" к ресурсам.

В довесок к модели команда создала платформу bitnet.cpp — специальную библиотеку, заточенную под запуск таких моделей на обычных CPU. Она показывает ускорение в 2–6 раз на x86 и до 5 раз на ARM-чипах. Всё это делает модель доступной даже для ноутбуков и встраиваемых систем.

Но есть и нюансы.

Хотя идея проста и гениальна, есть ограничения. Например, bitnet.cpp не поддерживает GPU, так что тем, кто хочет ускорения на видеокартах — придётся подождать. Кроме того, пока поддерживается ограниченный список аппаратных платформ. Но это — только начало.

Где это можно попробовать?

BitNet b1.58 2B4T уже доступна на Hugging Face и распространяется под лицензией MIT, то есть использовать её можно свободно — хоть в приложении для гаджетов, хоть в корпоративной разработке. И это может стать настоящим глотком свежего воздуха для разработчиков, которым не по карману фермы с GPU, но хочется внедрить ИИ в свои продукты.

Почему это важно?

Мы привыкли к тому, что большие языковые модели требуют больших серверов. Но Microsoft показывает, что умный ИИ может быть лёгким и доступным. Это особенно актуально для развивающихся стран, мобильных устройств, edge-сервисов и любой среды, где важны компактность и автономность.

BitNet b1.58 2B4T — это не просто ещё одна модель. Это знак, что эпоха “ИИ только в облаке” может смениться эпохой ИИ у вас на ноутбуке.