Пользователь Reddit добился успеха, запустив LLM с 1 триллионом параметров на рабочей станции, используя модули Optane PMem DIMM в качестве оперативной памяти, что вызвало ажиотаж в сообществе. — tomshardware.com Пользователь Reddit произвел фурор, заставив рабочую станцию с модулями Optane PMem DIMM, используемыми в качестве оперативной памяти, запустить большую языковую модель (LLM) с 1 триллионом параметров. APFrisco подробно изложил в мини-руководстве на сабреддите Local LLaMA, как им удалось приобрести подержанные модули постоянной памяти Intel Optane по относительно невысокой цене, чтобы «запустить модель с 1 триллионом параметров (в данном случае Kimi K2.5) локально со скоростью ~4 токена в секунду» на своей рабочей станции Xeon. Ключевым моментом этого достижения стала закупка пользователем шести модулей Optane PMem (DCPMM). Этот снятый с производства тип памяти был разработан для заполнения ниши между DRAM и SSD. Хотя 768 ГБ памяти Optane (6x 128 ГБ) действительно обеспечивают
768 ГБ дешевой памяти Intel Optane DIMM для запуска LLM с 1 триллионом параметров на системе с одной видеокартой
23 мая23 мая
62
2 мин