Нейросети сегодня делают значительно больше, чем просто заменяют нам поисковик данных. На них можно возложить анализ, структуризацию, оформление и стилизацию данных, а также создание визуального контента. Однако всё это становится недоступно, если у вас не работает интернет. Или нет?
Не совсем. Локальный Gemini от Google способен выручить в такой ситуации. Правда, нужно знать некоторые нюансы его работы, но на выходе у вас солидный ИИ-инструмент без интернета. Разбираемся, как это работает и куда можно установить прямо сейчас.
Содержание:
- Что такое локальный Gemini
- Как работает локальный Gemini
- Какие недостатки и особенности
- Какие устройства поддерживают
- Итог: полная замена онлайн-ИИ?
Что такое локальный Gemini
Это компактная нейросеть из семейства ИИ-моделей Google (по сути, это Gemini Nano), которая работает непосредственно на процессоре вашего устройства без подключения к интернету и без отправки данных на удаленные серверы. Локальный Gemini может работать на смартфонах, планшетах и компьютерах, но далеко не на любых — придется учитывать системные возможности и производительность девайса, так как ИИ требует немалых вычислительных мощностей.
Если упростить, то вот основные отличия локального от онлайн чат-бота:
- Автономность — все вычисления выполняются на вашем устройстве без подключения к интернету.
- Конфиденциальность — запросы и ответы не передаются на сервер, то есть Google получает меньше ваших данных (и грустит).
- Скорость — поскольку подключение к сети не требуется, ответы выдаются быстрее (но есть зависимость от производительности ЦП).
Как работает локальный Gemini
Это глубоко оптимизированная, автономная нейросеть, встроенная в операционную систему через специальную службу Android AICore. Ей не нужны серверы, так как вся математическая модель ИИ постоянно находится в оперативной памяти смартфона. Но как Google умудрилась уместить огромные базы нейросети в смартфон?
Оригинальные облачные модели Gemini действительно весят очень много, это буквально терабайты данных. Однако локальный Gemini Nano весит всего 2-4 Гб. Чтобы добиться такого уменьшения объема, базу данных «квантуют» — то есть переводят из формата высокой точности в 8-битный или 4-битный формат. Конечно, это снижает точность, но Google заверяет, что это происходит в незначительной степени. При этом вес уменьшается в десятки раз, а работа нейросети ускоряется.
Служба Android AICore здесь используется в качестве «диспетчера» нейросети, резервируя необходимое количество ОЗУ смартфона под базу данных и постоянно держа активным ИИ-ядро. По сути, модель работает нативно, через внутренние механизмы Android, что позволяет экономить ресурс ЦП и заряд батареи.
Как обрабатывается запрос на локальном Gemini:
- Вы отправляете запрос нейросети
- Запрос (или медиафайл) токенизируется, то есть разбивается на мелкие части
- Токены отправляются в ИИ-ядро, которое прогоняет их через сжатую базу Gemini Nano
- По результатам генерируется ответ слово за словом прямо на устройстве.
Вы получаете полноценную текстовую и аналитическую нейросеть на своем устройстве, которая не требует выхода в интернет для выполнения запросов. Среди прочего, она умеет хранить и учитывать контекст, даже если это длинные тексты, переписки или аудиозаписи.
Отдельным плюсом для жителей России является отсутствие необходимости настраивать всякого рода обходы и ухищрения: «облачный» Gemini официально не работает в РФ, а вот локальный не подключается к серверам и менее капризен к геолокации.
Но наверняка есть и минусы?
Какие недостатки и особенности
Их довольно много, настолько, что назвать локальный Gemini полноценным ИИ-помощником едва ли получится.
- Локальный Gemini не получает свежие знания из сети и не умеет искать там информацию. Базовые знания фиксируются в момент выпуска разработчиками, а позже дорабатываются лишь при выходах апдейтов через Google Play. То есть, бессмысленно спрашивать такой ИИ о последних новостях и событиях, курсах валют, погоде и других текущих моментах.
- Локальный бот не умеет создать и редактировать изображения и видео, он заточен исключительно на работу с текстом, а также небольшую поддержку аудиозаписей (например, диктофонных). Работа с фото ограничивается распознаванием и описанием того, что на нем изображено.
- Также у локального Gemini ограничено «окно контекста», оно в десятки раз меньше, чем у полноценных «облачных» моделей. Это значит, что он не сможет проанализировать, скажем, целую книгу или очень большой текстовый документ.
- Сложные и длинные логические рассуждения тоже могут вызывать трудности у локальной модели. Здесь сказывается то самое квантование, то есть сжатие баз данных ради умещения их на смартфон. Сложная логика, написание длинного кода, высшие математические задачи — всё это Gemini Nano может «запороть».
- Присутствуют и языковые ограничения. Основной язык разработки Gemini — английский, именно на нем локальная модель работает полноценнно. Другие, в том числе русский, конечно же, поддерживаются, но с ними нейросеть работает хуже, доступны в основном базовые возможности.
Среди других минусов — постоянно занятая оперативка смартфона, отсутствие обучения на действиях пользователя, меньшая универсальность в быту и полная зависимость от разработчиков.
Какие устройства поддерживают
Сразу обозначим: на iPhone и iPad невозможно установить локальный Gemini, по крайней мере, на момент публикации статьи. Для них доступны лишь онлайн-версии Gemini.
Основным требованием для Android-смартфонов и планшетов является не менее 12 Гб ОЗУ, а также достаточно современный флагманский процессор. Подобных устройств не так уж много:
Список совместимых смартфонов:
- Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
- Honor: 400 Pro, Magic 7, Magic 7 Pro, Magic 8 Pro, Magic V5
- iQOO: iQOO 13, iQOO 15
- Motorola: Razr 60 Ultra, Razr Ultra 2025, Signature
- OnePlus: OnePlus 15, OnePlus 15R, OnePlus 13, OnePlus 13s
- OPPO: Find N5, Find X9, Find X9 Pro, Find X8, Find X8 Pro, Reno 14 Pro 5G, Reno 15 Pro 5G, Reno 15 Pro Mini 5G, Reno 15 Pro Max 5G
- POCO: POCO F7 Ultra, POCO F8 Pro, POCO F8 Ultra, POCO X7 Pro, POCO X8 Pro
- realme: realme GT 7 Pro, realme GT 7T
- Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra, Galaxy S26, Galaxy S26+, Galaxy S26 Ultra, Galaxy Z Fold7, Galaxy Z TriFold.
- vivo: vivo X200T, vivo X200 FE, vivo X200, vivo X200 Pro, vivo X300, X300 Pro, vivo X Fold3 Pro, vivo X Fold5, vivo T4 Ultra
- Xiaomi: Xiaomi 14T Pro, Xiaomi 15, Xiaomi 15T, Xiaomi 15T Pro, Xiaomi 15 Ultra, Xiaomi 17, Xiaomi 17 Ultra.
Список совместимых планшетов:
- Google: Pixel Tablet всех поколений (1 gen с ограничениями)
- Lenovo: Lenovo Idea Tab Pro Gen 2, Lenovo Legion Tab Gen 5 (8,8 дюйма)
- Xiaomi: Xiaomi Pad Mini
- Samsung: Tab S9, Tab S9+, Tab S9 Ultra, Tab S10+, Tab S10 Ultra.
Что касается компьютеров, то на них локальный Gemini работает внутри браузера Google Chrome — он загружает на SSD модель весом 3-4 Гб автоматически, если ПК соответствует следующим требованиям:
- ОС: Windows, macOS или Linux.
- ОЗУ: 16 ГБ RAM и выше.
- Накопитель: свободно не менее 22 Гб.
- Видеокарта: дискретная или встроенная, от 4 ГБ видеопамяти (VRAM) либо современный процессор с NPU.
Итог: полная замена онлайн-ИИ?
Однозначно нет. Локальная нейросеть всё еще далека от своих «облачных» старших братьев, и основная причина тому — слишком маленькая мощность наших гаджетов. Каждый год нам кажется, что свежие чипы во флагманских смартфонах давно избыточны; может для бытовых задач это и верно, но для ИИ они всё еще крайне слабы.
Вероятно, Apple начала встраивать процессоры Silicon M в iPad именно с расчетом на будущие локальные вычисления Apple Intelligence. По той же причине Google не может запустить свой локальный Gemini на core-инструментах iOS и iPadOS.
Прямо сейчас локальный ИИ-агент — это хороший помощник в задачах, связанных с текстом. Например, составление писем, анализ и суммаризация больших документов, договоров и соглашений, ответы на «безвременные» вопросы, анализ содержимого изображений, транскрибирование диктофонных и прочих аудиозаписей в текст. На что-то большее рассчитывать не стоит. При этом нужно быть готовым пожертвовать некоторой частью ресурсов своего смартфона.