Найти в Дзене
Ivan Inby. Про ИИ и ИТ

ChatGPT без интернета на iPhone? Пробую Fullmoon

Fullmoon — это open-source приложение, которое превращает iPhone в офлайн-чат с нейросетью: без подписок, без облака, с моделями, которые скачиваются на устройство. На английском отвечает заметно лучше, на русском бывают артефакты и галлюцинации, зато для работы с готовым текстом (например, сократить статью) — очень даже. Всем привет, меня зовут Иван. Сегодня покажу, как пользоваться нейросетями на iPhone без интернета. Да, прям локально на телефоне — так, чтобы данные никуда не улетали в облака. Для этого нам понадобится приложение Fullmoon. Fullmoon — это по сути обычный чат: пишешь сообщение → нейросеть отвечает. Но ключевое — модель работает на устройстве, а значит: Проект open-source, исходники лежат на GitHub, а приложение доступно в App Store. Открываем App Store → в поиске вводим “Fullmoon” → находим приложение по иконке → Download. После установки жмём Open, и сразу попадаем в чат. Я просто написал “привет” — и получил ответ. Важно: это всё было без интернета, модель уже сто
Оглавление

Видеоверсия статьи

Fullmoon — это open-source приложение, которое превращает iPhone в офлайн-чат с нейросетью: без подписок, без облака, с моделями, которые скачиваются на устройство. На английском отвечает заметно лучше, на русском бывают артефакты и галлюцинации, зато для работы с готовым текстом (например, сократить статью) — очень даже.

Нейросети на iPhone без интернета: тестирую Fullmoon

Всем привет, меня зовут Иван. Сегодня покажу, как пользоваться нейросетями на iPhone без интернета. Да, прям локально на телефоне — так, чтобы данные никуда не улетали в облака.

Для этого нам понадобится приложение Fullmoon.

Что такое Fullmoon и почему это интересно

Fullmoon — это по сути обычный чат: пишешь сообщение → нейросеть отвечает. Но ключевое — модель работает на устройстве, а значит:

  • можно пользоваться в метро/лифте/самолёте/за границей без связи
  • можно не отправлять чувствительные заметки “куда-то наружу”
  • никакой подписки и облачных “платных токенов” (в базовом сценарии)

Проект open-source, исходники лежат на GitHub, а приложение доступно в App Store.

Официальный сайт Fullmoon / страница проекта
Официальный сайт Fullmoon / страница проекта

Установка: 30 секунд

Открываем App Store → в поиске вводим “Fullmoon” → находим приложение по иконке → Download.

Cтраница Fullmoon в App Store
Cтраница Fullmoon в App Store

Первый запуск: это реально офлайн-чат

После установки жмём Open, и сразу попадаем в чат.

Я просто написал “привет” — и получил ответ. Важно: это всё было без интернета, модель уже стояла на моём iPhone.

Главный экран чата + пример “привет” → ответ
Главный экран чата + пример “привет” → ответ

Быстрый обзор настроек (самое полезное)

Я пробежался по настройкам — там есть несколько вещей, которые реально влияют на опыт:

1) Внешний вид чата

Можно настроить стиль: цвета, ширину/высоту, общий дизайн — под себя. Есть светлая/тёмная тема.

Настройки внешнего вида / темы
Настройки внешнего вида / темы

2) System prompt (системный промпт)

Можно задать “правила поведения” модели, чтобы она всегда отвечала в нужном стиле. По умолчанию там что-то вроде “ты полезный помощник”.

Экран с system prompt
Экран с system prompt

3) Haptic (вибро-отклик)

При ответе и даже при “печати” со стороны бота можно включить вибрацию. Прикольно, но на любителя.

4) Модели: что скачать и сколько занимает

Самое интересное — список доступных моделей и уже установленные.

Если очень грубо:

  • чем больше модель по размеру — тем она обычно точнее
  • чем меньше — тем работает быстрее, но чаще ошибается

Внутри я видел варианты вроде:

  • Llama 3.2 (1B и 3B)
  • DeepSeek
  • и другие сборки в 4-bit / 8-bit вариантах
писок моделей + какие установлены/выбраны + размер
писок моделей + какие установлены/выбраны + размер

Где Fullmoon реально спасает: 2 главных сценария

Я для себя выделяю два прям железных кейса:

1) Нет интернета, но надо “быстро спросить”

Метро, лифт, самолёт, роуминг, плохая связь — классика.

2) Не хочется светить данные

Когда текст личный или рабочий, и ты не хочешь отправлять его в облачный сервис.

Тест №1: “что такое холодильник” — быстро, но с артефактами

Я спросил у модели: “Что такое холодильник?”

Ответ прилетел быстро и по смыслу был правильный… но появились артефакты:

  • отдельные английские слова типа device вместо “устройство”
  • странные заимствования (например, “freshness” вместо “свежесть”)
  • местами повторяющиеся абзацы

То есть пользоваться можно, но на русском иногда видно, что модель “плывёт”.

Вопрос “что такое холодильник” + фрагмент ответа с англ. словами/повторами
Вопрос “что такое холодильник” + фрагмент ответа с англ. словами/повторами

Тест №2: “что такое синоним” — уже лучше

Потом я спросил: “Что такое синоним?”

Здесь ответ получился гораздо более читаемым:

  • определение нормальное
  • примеры есть
  • логика выдержана

Да, местами встречались мелкие артефакты (буквы/вставки), но в целом — ок.

Вопрос “что такое синоним” + ответ
Вопрос “что такое синоним” + ответ

Когда Fullmoon раскрывается: работа с готовым текстом

Дальше я проверил не “генерацию из головы”, а задачу сокращения текста.

Я вставил большой кусок текста (брал статью из Википедии) и попросил сократить. В итоге:

  • было несколько абзацев
  • стало один абзац
  • артефактов заметно меньше
  • ощущение, что точность выше, потому что модель “опирается на исходник”, а не сочиняет
Вставленный большой текст
Вставленный большой текст
Результат сокращения
Результат сокращения

Английский vs русский: на английском заметно увереннее

Я сделал ещё один показательный тест — спросил про игру Death Stranding на английском.

На английском:

  • ответ получился большой, связный, без странных символов
  • читается уверенно
  • скорость примерно такая же, как на русском
Вопрос про Death Stranding на английском + ответ
Вопрос про Death Stranding на английском + ответ

Потом спросил то же самое, но на русском — и вот тут уже было видно, что модель может:

  • вставлять иероглифы/символы
  • смешивать языки
  • и самое неприятное — галлюцинировать (уверенно рассказывать детали, которых в реальности нет)

Вопрос на русском
Вопрос на русском

Мой вывод простой:

  • на русском пользоваться можно, но надо держать в голове, что будет шум и иногда фантазии
  • на английском качество ощутимо выше (если вы готовы читать английский)

Бонус: интеграция с “Командами” на iPhone

Вот это мне прям понравилось.

У Fullmoon есть интеграция с Shortcuts / Команды:

  • можно выделить текст на странице
  • нажать “Поделиться”
  • запустить команду (например “Сократи текст”)
  • и получить короткий результат в окошке предпросмотра

То есть нейросеть становится “встроенной кнопкой” для обработки текста — очень удобно.

Быстрая команда
Быстрая команда
Результат вызова быстрой команды
Результат вызова быстрой команды

Итоги: плюсы, минусы и кому зайдёт

Плюсы

  • работает локально и оффлайн
  • ставится за пару кликов
  • без подписок и без облака
  • отлично подходит для задач с готовым текстом (сократить/переформулировать)

Минусы

  • встроенные модели не такие мощные, как облачные
  • на русском бывают артефакты и галлюцинации
  • скорость зависит от iPhone: на моём iPhone 16 Pro Max всё ок, но на более старых (например iPhone 12/13 и ниже) будет заметно медленнее

Если досмотрели (и дочитали) до конца — спасибо! Подписывайтесь на мой канал, и телеграм

Ivan Inby. Про ИИ и ИТ

и бусти!

Ivan Inby - Продвигаю ИИ в массы