В эпоху, когда крупные модели ИИ становятся «чёрными ящиками», проект LLMs-from-scratch от Себастьяна Раски даёт нам редкий шанс взглянуть под капот. В свежем разделе появилась чистая реализация Gemma 3 270M на PyTorch — без сторонних библиотек, без скрытых оптимизаций, полностью открытый код. Большинство разработчиков знакомы с LLM только через высокоуровневые API. Но такие проекты позволяют: Я считаю такие реализации ключевыми для будущего индустрии. Огромные закрытые модели — это здорово для бизнеса, но прозрачность и доступность экспериментов определяют, появятся ли новые идеи в архитектуре. KV-кэш, который здесь реализован вручную, — отличный пример: когда понимаешь механику, начинаешь иначе смотреть и на оптимизацию, и на компромиссы в дизайне LLM. Это напоминает историю Linux: когда-то «игрушечная ОС» для студентов стала ядром мировой инфраструктуры. Кто знает, может именно такие «from scratch»-проекты сегодня закладывают основу будущего поколений ИИ. 🔗 Источник: Gemma 3 270M r
✴️ Gemma 3 в чистом PyTorch: игрушка или шаг к прозрачным LLM?
21 августа 202521 авг 2025
8
1 мин