Google Gemma 3n представляет прорывную технологию в области on-device AI с уникальной архитектурой MatFormer и технологией Per-Layer Embeddings, позволяющую запускать мультимодальные модели с 5-8 млрд параметров, используя всего 2-3 ГБ оперативной памяти на смартфонах и ноутбуках. Google представила Gemma 3n на конференции Google I/O 2025 как новейшую модель семейства Gemma, специально разработанную для эффективной работы на мобильных устройствах. Основой революционной эффективности модели служат три ключевые архитектурные инновации. Сердцем Gemma 3n является архитектура MatFormer (Matryoshka Transformer) — уникальное решение с вложенными трансформерами, подобное русским матрёшкам. В процессе обучения модели E4B (4 млрд эффективных параметров) одновременно оптимизируется вложенная подмодель E2B (2 млрд эффективных параметров). Эта архитектура позволяет разработчикам: Технология Per-Layer Embeddings кардинально меняет подход к использованию памяти. Хотя модели имеют 5 и 8 млрд параметро
Gemma 3n: Революция мобильного ИИ с работой на устройстве
26 июня 202526 июн 2025
1
3 мин