Найти в Дзене
Хайтек+

Новый 4-битный метод обучения БЯМ не уступает 8-битному

Новый 4-битный метод обучения БЯМ не уступает 8-битному Новый подход к обучению больших языковых моделей (БЯМ), который разработали исследователи из Nvidia, позволяет обучать модели, которые не просто превосходят ведущие 4-битные форматы по стабильности и точности, но достигают уровня производительности 8-битного формата FP8. При этом технология NVFP4 использует вдвое меньше памяти и лишь малую долю вычислительных ресурсов. https://hightech.plus/2025/10/30/novii-4-bitnii-metod-obucheniya-byam-ne-ustupaet-8-bitnomu

Новый 4-битный метод обучения БЯМ не уступает 8-битному

Новый подход к обучению больших языковых моделей (БЯМ), который разработали исследователи из Nvidia, позволяет обучать модели, которые не просто превосходят ведущие 4-битные форматы по стабильности и точности, но достигают уровня производительности 8-битного формата FP8. При этом технология NVFP4 использует вдвое меньше памяти и лишь малую долю вычислительных ресурсов.

https://hightech.plus/2025/10/30/novii-4-bitnii-metod-obucheniya-byam-ne-ustupaet-8-bitnomu