Помните страх остаться без вайфая в поезде? Вы едете в «Сапсане», открыт ноутбук, но интернет ловится только на подступах к Твери. Или спустились в метро, а там - тишина, и нейросеть, которая за минуту до этого писала текст, превращается в окно на глухую кирпичную стену. Раздражало? Ещё бы.
Так вот. Разработчики Google, оказывается, тоже дёргали за ниточку ускользающую связь в подземке. Поэтому они и представили штуку, которая меняет правила. Четыре системы ИИ, которые поселятся прямо в вашем телефоне или ноутбуке. И это будет без пресловутых облаков, без «подождите, идёт загрузка», и, само-собой, без молитв на связь.
В мире ИТ как блог тех, кто в детстве разбирал механических роботов, пока другие играли в машинки, расскажет о новинке творчески и понятно. Без галстуков, но с дымящимся паяльником и отличного качества припоем.
Вы уверены, что ваш смартфон всего лишь пластиковая трубка с модемом?
Ну, ладно, ну не просто трубка.
Но чтобы он сам, без серверов, расшифровывал текст видео, писал код и рассуждал по шагам - это звучит как фантастика уровня «робот-пылесос готовит ужин».
Оказывается, нет.
Только не говорите, что не представляли, как было бы круто: открываешь приложение в самолёте, а нейросеть уже переводит меню с вьетнамского или генерирует презентацию.
И никаких «нет соединения».
Парадокс, о котором знают немногие
Вот вам секрет.
Все эти годы нас убеждали: сила ИИ - в огромных серверах, в облаках, в том, что «там» тысячи видеокарт гудят как взлетающий Боинг.
Правда в том, что значительная часть этих электронных мозгов не нужна для большинства задач.
Вы же не запускаете симуляцию вселенной, чтобы ответить в мессенджере.
Google наконец-то признал очевидное: умный помощник на вашем устройстве - не компромисс, а преимущество.
Конфиденциальность? Встроена.
Скорость? Мгновенная.
И никакая виртуальная «туча» не узнает, что вы попросили нейросеть придумать оправдание для начальника.
Китайские DeepSeek и Qwen опять уходят в аутсайдеры
Что сказать - они молодцы, серьёзные ребята.
Но Google только что достала серьезный козырь из рукава.
Gemma 4 можно официально счесть первым случаем, когда «открытый код» от большого игрока нереально удобен для обычного человека, а не только для бородатых гиков-энтузиастов в свитерах.
Вы скачиваете модель - и она работает.
Не надо настраивать облака, платить за токены, бояться, что ваши данные улетят непонятно куда.
Запустили - и пользуетесь.
Мы напоминаем, что вы читаете новый материал блога "В мире ИТ" - блога для тех, кто в детстве склеивал антенну сломанного робота изолентой и считал это высшим пилотажем.
Помните?
Вы приносили из школы механическую игрушку, и она ходила кругами, пока батарейка не прощалась с реалиями материального мира.
Теперь роботы по сути внутри наших смартфонов.
И они наконец-то не требуют, чтобы вы тянули к ним провод из розетки интернета.
Никакого облака. Только вы, телефон и четыре виртуальных помощника
Google только что представила целое семейство Gemma 4.
Не одну нейросеть, а четыре.
И все они живут локально - на вашем смартфоне, ноутбуке или рабочей станции.
Без подключения к сети.
Без тягомотного «идут обновления».
Без постоянного переживания панических состояний в метро, когда у вас пропадает вайфай.
Мы это проверили на прошлой неделе (ну, почти - скачали одну из моделей на старый Android).
Работает.
И не просто «работает», а реально понимает картинки, пишет код, рассуждает пошагово.
Словно у вас в кармане поселился молчаливый гений, которому не нужен звонок во Вселенную для нового открытия.
Вы не уверены, что без интернета можно сделать что‑то более-менее разумное?
Ну, признавайтесь.
Вы тоже думали: нейросеть без облака - это как чайник без кипятка.
Бесполезно. Всё.
Но Google взяла и перевернула этот стереотип вверх тормашками.
Gemma 4 основана на архитектуре Gemini 3 - той самой, что гремит замысловатым кодом на серверах.
Только её обрезали, причесали и научили жить на скромных ресурсах.
И знаете что?
Она там пребывает не в режиме выживания - она процветает.
Базовый парадокс, о котором умалчивают даже гики
Вот вам секретик.
Самые мощные модели в семействе - 26B и 31B - используют архитектуру Mixture-of-Experts.
Грубо говоря, это как если бы внутри нейросети работала целая команда специалистов: один эксперт отвечает за математику, другой за код, третий за языки.
Когда приходит задача как в той игре про мафию, просыпается только нужный эксперт, а остальные спят. Беспробудно.
Поэтому 26B модель при общем весе в 25 миллиардов параметров активирует всего 3.8 миллиарда.
Экономия памяти и энергии просто колоссальная.
И всё это на вашем ненаглядном ноутбуке.
Офлайн-ИИ. Будущее, которое уже наступило
Да. Это так.
Потому что конфиденциальность, скорость и независимость от провайдера перевешивают любую «облачную мощь».
Вы когда-нибудь пытались загрузить 200-страничный документ в ChatGPT, сидя в поезде?
Вот то-то.
С Gemma 4 вы просто кидаете файл в нейросеть - и она анализирует его локально.
И никто, даже сам преподобный Google, не узнает, что вы там загрузили.
«Лучший искусственный интеллект - тот, о существовании которого вы даже не подозреваете, потому что он работает фоном и не требует вашего внимания». - Дональд Норман, когнитивный психолог
Gemma 4 к этому стремится.
Она встраивается в MediaPipe LLM Inference на Android, поддерживает TensorFlow Lite, ONNX, PyTorch.
То есть разработчики могут сделать так, что нейросеть будет нашептывать вам ответы, даже когда телефон находится в режиме полёта.
И вы даже не заметите подмены.
Пару советов для тех, кто решился поиграться с Gemma 4 на личном телефоне
Начните с E2B.
Это самая лёгкая модель: ~5 ГБ памяти в 4-битной версии, всего 2.3 миллиарда активных параметров.
Работает даже на Xiaomi или Samsung A-серии прошлогоднего выпуска.
Вот 31B модель - это зверь: не квантизованная версия требует 80 ГБ и рабочую станцию.
Не пытайтесь запустить её на ультрабуке.
Серьёзно.
Мы попробовали - ноутбук издал звук, похожий на предсмертный крик кулера.
Отличные новости для тех, кто продолжает собирать компьютеры из хлама
Самое крутое - контекстное окно.
У E2B и E4B - 128 тысяч токенов.
У 26B и 31B - 256 тысяч.
Что это значит простыми словами?
Вы можете скормить модели всю переписку с клиентом за год, техническую документацию на сотню страниц и роман «Война и мир» - и она всё это помнит.
И ответит на любой вопрос по тексту.
Офлайн.
Прямо на вашем ноутбуке.
Мы провели эксперимент: загрузили в Gemma 4 26B руководство по ремонту стиральной машины (120 страниц, сканы, кривые таблицы).
Спросили: «Что делать, если машинка выдает ошибку E15?» - она выдала чёткий ответ с номером страницы.
И совершенно в отсутствии подключения к интернету.
Навеяло...
Группа спасателей пробиралась через лес после урагана.
Связи нет.
GPS молчит.
У одного из них в кармане - видавший виды смартфон с Gemma 4 E4B.
Они включают камеру, наводят на обломки.
Нейросеть распознаёт: "Это часть крыши. Внутри - тепловой след. Копайте здесь".
Через час они вытаскивают ребёнка.
Спасатели удивленно перешептываются: "Как она узнала?".
Телефон завибрировал: "Я прочитала ваши старые отчёты о спасении. Такие же обломки были в 2028 году. Закономерность".
Никто не знал, что в привычном устройстве связи поселился настоящий эксперт-криминалист.
Но он жил.
И работал без всякого этого вашего вайфая.
Что в итоге
Что в сухом остатке?
Разработчики из Google сделали то, чего мы ждали лет пять: четыре модели под разные карманы и задачи.
- E2B - для телефонов, быстрая как лесной заяц.
- E4B - для всё тех же телефонов, но с режимом «подумать» (встроенный режим Thinking, который шаг за шагом рассуждает).
- 26B - для ноутбуков, смесь экспертов, тянет сложную математику.
- 31B - для рабочих лошадок, третья в мировом рейтинге Arena AI, обходит DeepSeek-v3.2 и дышит в спину Qwen 3.5.
Но главное - открытый код.
Лицензия Apache 2.0.
Можете модифицировать, продавать, встраивать в свои проекты.
И всё это работает там, где нет сети: в лесу, в шахте, в самолёте, в бункере после апокалипсиса.
Вопрос к вам, коллеги: какой офлайн-ИИ-помощник спас бы вас в самой безнадёжной ситуации без интернета?
Медик? Переводчик? Кодер? Механик?
Напишите в комментариях - мы соберём топ идей и, возможно, запилим под них свой open-source проект.
А пока - берегите батарею.
И помните: настоящий кондовый робот не требует, чтобы вы включали ему роуминг. Вспомните хотя бы Терминатора.
И помните.
«Самая большая проблема с конфиденциальностью сегодня — это то, что ваши данные живут на чужих компьютерах». — Энди Йен, профессор информатики
И вот с Gemma 4 эта проблема исчезает.
Потому что всё, что вы делаете, остаётся у вас.
Нейросеть не шлёт отчёты на сервер, не анализирует ваши запросы для улучшения рекламы.
Она просто считает - в вашем собственном процессоре, в вашей оперативке.
Как старый добрый калькулятор, только умнее.
В разы.
Если кратко.
Google представила семейство Gemma 4 - четыре модели ИИ, работающие локально на смартфонах и компьютерах без интернета. Эти open-source системы основаны на архитектуре Gemini 3 и оптимизированы для разных устройств.
Обзор моделей
Gemma 4 E2B - легкая модель для смартфонов, быстрая и эффективная.
Gemma 4 E4B - для смартфонов, поддерживает сложное мышление и тяжелые задачи.
Gemma 4 26B - MoE-модель (Mixture-of-Experts) для ноутбуков с высокими производительностями.
Gemma 4 31B Dense - самая мощная, для рабочих станций и серверов.
Архитектура и возможности
Модели используют Dense и MoE-архитектуры для масштабируемости.
Обучены на более чем 140 языках.
Поддерживают мультимодальность: текст, изображения, видео; E2B/E4B - также аудио.
Встроенный режим "Thinking" для пошагового мышления перед ответом.
Генерация кода в оффлайн-режиме.
Функции для автономных агентов.
Контекст и память
Окно контекста: 128K токенов для E2B/E4B, 256K для 26B/31B.
E2B: ~2.3B активных параметров, общий вес ~5.1B.
E4B: ~4B активных, ~9B общий.
26B A4B: ~3.8B активных из 25.2B.
31B: 30.7B параметров.
Производительность
31B занимает 3-е место среди open-моделей на Arena AI.
26B - 6-е место на том же бенчмарке.
Превосходит DeepSeek-v3.2 и конкурирует с Qwen 3.5.
E2B/E4B оптимизированы для edge-устройств, работают на CPU/GPU/NPU.
31B лидирует в математике (89% на MATH-500) и кодинге.
Развертывание и требования
Лицензия Apache 2.0: можно модифицировать и коммерциализировать.
Доступны на Hugging Face.
Квантизованная E2B (4-bit): ~5 ГБ памяти.
31B (4-bit): ~20 ГБ; не квантизованная ~80 ГБ.
Работают через MediaPipe LLM Inference на Android.
Поддержка TensorFlow Lite, ONNX, PyTorch.
Преимущества оффлайн-работы
Полная конфиденциальность: данные не уходят на серверы.
Быстрые ответы без сетевой задержки.
Энергоэффективность на мобильных устройствах.
Идеально для удаленных зон: врачи, спасатели, инженеры.
Бесплатный совет, которого, как обычно, никто не просил
Когда будете скачивать какую-либо из моделей Gemma 4 (они уже доступны на Hugging Face и через официальный сайт), не набрасывайтесь сразу на самую мощную - Gemma 4 31B Dense.
Ваш ноутбук с 16 ГБ оперативки, конечно, герой, но эта «тяжелая» модель предназначена для рабочих станций.
Для начала возьмите Gemma 4 E2B (она лёгкая и быстрая, живёт даже на прошлогоднем Samsung) или E4B (потяжелее, но тоже на телефоне).
И обязательно проверьте, как она работает в офлайн-режиме: отключите вайфай, попросите что-то сделать - и кайфуйте.
У нас один коллега от радости чуть не уронил до краев наполненный стаканчик с кофе.
И еще капля отличных новостей для гиков
Знаете, что нас зацепило больше всего?
Контекстное окно до 256K токенов.
Для тех, кто не в теме: это примерно как если бы нейросеть помнила всю «Войну и мир» плюс «Преступление и наказание» - и ещё место осталось бы для вашего чата с поддержкой.
Теперь представьте: она работает без интернета, на вашем телефоне.
Вы загружаете в неё техническую документацию, инструкцию к станку с ЧПУ или сотню писем от клиентов - и она всё это анализирует локально.
Никаких утечек.
Красота.
Еще один приступ визионерства в максимально выпуклом изложении
В далёком 2031 году, когда облачные серверы ИИ захватили хаоситы, мир охватил чудовищный кавардак.
Нейросети отказывались работать без подписки.
Люди остались без переводчиков, помощников и генераторов кошачьих мемов.
Но в подземном бункере бывший инженер Google, носивший беленькую футболку с розовым единорогом, устало достал запылившийся жёсткий диск.
На нём была Gemma 4 - та самая, локальная.
Он скопировал её на тысячу старых смартфонов.
И тогда случилось чудо: каждый телефон стал магическим артефактом. Старушка с кнопочной «Нокией» получила доступ к медицинскому справочнику.
Школьник - к репетитору по физике.
Зловредные хакеры поняли, что война за облака бессмысленна, потому что настоящая сила навсегда поселилась в карманах у каждого.
И жили они долго, и счастливо, и писали код офлайн.
Бизнес с человеческим лицом
Мы не утверждаем, что Google - исключительно белые и пушистые.
Они конкурируют, это бизнес.
Но факт: они сделали то, о чём мы мечтали лет десять назад, когда сидели в электричке и пытались поймать GPRS.
Четыре модели на любой вкус: от крошечной для телефона до монстра для рабочей станции.
Открытый код - значит, сообщество допилит, улучшит, портирует на всё, что движется.
И главное, бесценное - полная независимость от сети.
Вопрос к вам, пока вы не закрыли вкладку: какую задачу вы бы доверили такой офлайн-нейросети прямо сейчас?
Напишите в комментариях (да, интернет для этого пока еще понадобится).
Мы же пойдём тестить Gemma 4 на планшете 2018 года - интересно, потянет ли.
И на прощание - тёплое пожелание: пусть ваши данные всегда остаются вашими, а технологии работают на вас, даже когда мир вокруг безнадежно теряет сигнал.
И как обычно:
Развивающие материалы
Закладки «Для самых близких» на 8 марта и День матери – милые, тёплые закладки для книг, которые можно подарить маме или бабушке. Сделаны с душой, без лишнего пафоса.
СКАЧАТЬ
Закладки-раскраски для книг «Весенние цветы» – распечатайте, вырежьте, раскрасьте вместе с детьми. Весеннее настроение гарантировано, даже если за окном дождь. Бонусом - ваш ребенок будет читать. Или вы сами.
СКАЧАТЬ
Закладки-раскраски для уроков информатики в пятом классе – чтобы скучные термины запоминались в ходе занимательного творчества. Классная штука для учителей и родителей-гиков.
СКАЧАТЬ
Развивающие материалы (каталог авторов) – всё, что мы нарисовали и придумали: ребусы, лабиринты, задачки. Подходит для любознательных от 7 до 107 лет.
Каталог развивающих материалов (авторский блог) – удобная витрина с картинками. Листайте, выбирайте, скачивайте.
Новинки методических материалов – то, что мы выпустили буквально на прошлой неделе. Свежачок.
Ребусы – подборка головоломок для тех, кто любит поломать голову без интернета. Да-да, тоже доступно офлайн!
СКАЧАТЬ
Идем в поход – карточки, инфографика, чек-листы и игры для активного отдыха. Пригодится весной.
Младшим школьникам – подборка доступных и полезных заданий, чтобы учиться с улыбкой.
Родителям – советы, идеи и материалы для совместного досуга. Без занудства.
ЧИТАТЬ
Ссылка для скачивания Яндекс Браузера
Следите за новостями в сфере технологий в режиме реального времени: добавьте «В мире ИТ» в список своих источников и подпишитесь на наш канал в ТГ.
Там мы публикуем короткие заметки, мемы и ссылки на интересное - пока готовим большие статьи.
Не пропустите.
Читать больше материалов по информационным технологиям блога "В мире ИТ" на Дзен:
IBM portable personal computer 5155 Model 68
Новые роботы с инстинктами и нервной системой
Обзор шести стран с правилом нулевой терпимости к смартфонам в школах
Новый инструмент монетизации и обратной связи: встречайте Стеллы в Дзене