Найти в Дзене

Microsoft представила 1-битную модель ИИ с улучшенной вычислительной эффективностью

Компания Microsoft представила новую модель нейронной сети BitNet b1.58 2B4T, которая использует необычную троичную систему весов, состоящую всего из трех значений: -1, 0 и 1. Это открывает новые горизонты для снижения вычислительных затрат и энергетической потребности в разработке и запуске искусственного интеллекта. Ключевые особенности модели: Производительность и эффективность: Несмотря на упрощение точности весов, BitNet b1.58 не уступает в производительности более крупным моделям с полной точностью при тестировании на ряде задач, таких как рассуждения, математические задачи и обработка знаний. Исследования показали, что модель достигает производительности, близкой к ведущим моделям, но при этом она значительно более эффективна с точки зрения использования ресурсов. Потенциал для будущих разработок: Это новое исследование открывает перспективы для создания более энергоэффективных моделей ИИ, которые смогут работать на стандартных процессорах, не требуя дорогих и мощных графических

Компания Microsoft представила новую модель нейронной сети BitNet b1.58 2B4T, которая использует необычную троичную систему весов, состоящую всего из трех значений: -1, 0 и 1. Это открывает новые горизонты для снижения вычислительных затрат и энергетической потребности в разработке и запуске искусственного интеллекта.

Ключевые особенности модели:

  1. Снижение точности весов: Вместо традиционного использования 16- или 32-битных значений для представления весов, модель BitNet использует "1.58 бит", что соответствует троичной системе с тремя возможными значениями для каждого веса. Это упрощает вычисления и значительно сокращает объем памяти.
  2. Меньшие требования к памяти: Модель BitNet b1.58 использует всего 0,4 ГБ памяти, в отличие от более традиционных моделей с аналогичным числом параметров, которые требуют 2-5 ГБ. Это делает ее гораздо более доступной для использования на стандартных центральных процессорах (CPU), а не дорогих графических процессорах (GPU).
  3. Эффективность вычислений: Троичная система весов позволяет использовать более простые операции сложения вместо сложных операций умножения, что делает модель менее энергоемкой. В результате, BitNet b1.58 потребляет на 85-96% меньше энергии по сравнению с моделями полной точности.
  4. Повышенная скорость работы: Использование специализированного ядра для этой архитектуры позволяет модели работать значительно быстрее. Время обработки достигает 5-7 токенов в секунду, что приравнивается к скорости чтения человека. Модель может эффективно работать на нескольких процессорах ARM и x86.

Производительность и эффективность:

Несмотря на упрощение точности весов, BitNet b1.58 не уступает в производительности более крупным моделям с полной точностью при тестировании на ряде задач, таких как рассуждения, математические задачи и обработка знаний. Исследования показали, что модель достигает производительности, близкой к ведущим моделям, но при этом она значительно более эффективна с точки зрения использования ресурсов.

Потенциал для будущих разработок:

Это новое исследование открывает перспективы для создания более энергоэффективных моделей ИИ, которые смогут работать на стандартных процессорах, не требуя дорогих и мощных графических карт. В будущем такие модели могут стать более доступными для широкого круга пользователей, включая небольшие компании и исследовательские лаборатории.

Однако, несмотря на успех, исследователи признались, что не до конца понимают, почему упрощенная модель так хорошо справляется с задачами ИИ, и признают, что необходимо провести дальнейшие исследования, чтобы более точно объяснить этот эффект.

Заключение:

Модель BitNet b1.58 представляет собой прорыв в области искусственного интеллекта, предлагая значительное снижение вычислительных затрат без потери качества. Она показывает, что будущие ИИ-системы могут работать эффективно и без необходимости в огромных вычислительных мощностях, что делает их более доступными и устойчивыми с точки зрения энергозатрат. В дальнейшем такие подходы могут изменить ландшафт технологий ИИ, сделав их более экологичными и доступными для различных пользователей.

Источник: https://arstechnica.com/ai/2025/04/microsoft-researchers-create-super%e2%80%91efficient-ai-that-uses...

Больше интересного – на медиапортале https://www.cta.ru/

Microsoft
32,8 тыс интересуются