LLM на 400 млрд параметров обычно требуют 200 ГБ ОЗУ, но энтузиаст смог запустить такую модель на iPhone 17 Pro, используя проект Flash-MoE и SSD для потоковой передачи данных на GPU. Скорость генерации — всего 0,6 токена/с. — wccftech.com Большие языковые модели (LLM) с 400 миллиардами параметров могут работать только на производительном оборудовании с огромным объемом памяти, поскольку даже квантованная или сжатая версия требует минимум 200 ГБ оперативной памяти. Учитывая такие высокие требования, iPhone 17 Pro никогда не был бы первым выбором для запуска LLM на 400B, но видеодоказательства говорят об обратном: один человек продемонстрировал, что текущее поколение Apple совершило невозможное. Однако следует отметить, что этого подвига не удалось бы достичь без некоторых хитроумных уловок, так что давайте рассмотрим эти детали. На iPhone 17 Pro работал проект с открытым исходным кодом под названием Flash-MoE, и пользователь @anemll показал, что, хотя флагман может запускать эту безумн
На iPhone 17 Pro успешно запустили LLM на 400 млрд параметров: для этого нужно минимум 200 ГБ памяти
23 марта23 мар
16
2 мин