Видеоверсия статьи
Fullmoon — это open-source приложение, которое превращает iPhone в офлайн-чат с нейросетью: без подписок, без облака, с моделями, которые скачиваются на устройство. На английском отвечает заметно лучше, на русском бывают артефакты и галлюцинации, зато для работы с готовым текстом (например, сократить статью) — очень даже.
Нейросети на iPhone без интернета: тестирую Fullmoon
Всем привет, меня зовут Иван. Сегодня покажу, как пользоваться нейросетями на iPhone без интернета. Да, прям локально на телефоне — так, чтобы данные никуда не улетали в облака.
Для этого нам понадобится приложение Fullmoon.
Что такое Fullmoon и почему это интересно
Fullmoon — это по сути обычный чат: пишешь сообщение → нейросеть отвечает. Но ключевое — модель работает на устройстве, а значит:
- можно пользоваться в метро/лифте/самолёте/за границей без связи
- можно не отправлять чувствительные заметки “куда-то наружу”
- никакой подписки и облачных “платных токенов” (в базовом сценарии)
Проект open-source, исходники лежат на GitHub, а приложение доступно в App Store.
Установка: 30 секунд
Открываем App Store → в поиске вводим “Fullmoon” → находим приложение по иконке → Download.
Первый запуск: это реально офлайн-чат
После установки жмём Open, и сразу попадаем в чат.
Я просто написал “привет” — и получил ответ. Важно: это всё было без интернета, модель уже стояла на моём iPhone.
Быстрый обзор настроек (самое полезное)
Я пробежался по настройкам — там есть несколько вещей, которые реально влияют на опыт:
1) Внешний вид чата
Можно настроить стиль: цвета, ширину/высоту, общий дизайн — под себя. Есть светлая/тёмная тема.
2) System prompt (системный промпт)
Можно задать “правила поведения” модели, чтобы она всегда отвечала в нужном стиле. По умолчанию там что-то вроде “ты полезный помощник”.
3) Haptic (вибро-отклик)
При ответе и даже при “печати” со стороны бота можно включить вибрацию. Прикольно, но на любителя.
4) Модели: что скачать и сколько занимает
Самое интересное — список доступных моделей и уже установленные.
Если очень грубо:
- чем больше модель по размеру — тем она обычно точнее
- чем меньше — тем работает быстрее, но чаще ошибается
Внутри я видел варианты вроде:
- Llama 3.2 (1B и 3B)
- DeepSeek
- и другие сборки в 4-bit / 8-bit вариантах
Где Fullmoon реально спасает: 2 главных сценария
Я для себя выделяю два прям железных кейса:
1) Нет интернета, но надо “быстро спросить”
Метро, лифт, самолёт, роуминг, плохая связь — классика.
2) Не хочется светить данные
Когда текст личный или рабочий, и ты не хочешь отправлять его в облачный сервис.
Тест №1: “что такое холодильник” — быстро, но с артефактами
Я спросил у модели: “Что такое холодильник?”
Ответ прилетел быстро и по смыслу был правильный… но появились артефакты:
- отдельные английские слова типа device вместо “устройство”
- странные заимствования (например, “freshness” вместо “свежесть”)
- местами повторяющиеся абзацы
То есть пользоваться можно, но на русском иногда видно, что модель “плывёт”.
Тест №2: “что такое синоним” — уже лучше
Потом я спросил: “Что такое синоним?”
Здесь ответ получился гораздо более читаемым:
- определение нормальное
- примеры есть
- логика выдержана
Да, местами встречались мелкие артефакты (буквы/вставки), но в целом — ок.
Когда Fullmoon раскрывается: работа с готовым текстом
Дальше я проверил не “генерацию из головы”, а задачу сокращения текста.
Я вставил большой кусок текста (брал статью из Википедии) и попросил сократить. В итоге:
- было несколько абзацев
- стало один абзац
- артефактов заметно меньше
- ощущение, что точность выше, потому что модель “опирается на исходник”, а не сочиняет
Английский vs русский: на английском заметно увереннее
Я сделал ещё один показательный тест — спросил про игру Death Stranding на английском.
На английском:
- ответ получился большой, связный, без странных символов
- читается уверенно
- скорость примерно такая же, как на русском
Потом спросил то же самое, но на русском — и вот тут уже было видно, что модель может:
- вставлять иероглифы/символы
- смешивать языки
- и самое неприятное — галлюцинировать (уверенно рассказывать детали, которых в реальности нет)
Мой вывод простой:
- на русском пользоваться можно, но надо держать в голове, что будет шум и иногда фантазии
- на английском качество ощутимо выше (если вы готовы читать английский)
Бонус: интеграция с “Командами” на iPhone
Вот это мне прям понравилось.
У Fullmoon есть интеграция с Shortcuts / Команды:
- можно выделить текст на странице
- нажать “Поделиться”
- запустить команду (например “Сократи текст”)
- и получить короткий результат в окошке предпросмотра
То есть нейросеть становится “встроенной кнопкой” для обработки текста — очень удобно.
Итоги: плюсы, минусы и кому зайдёт
Плюсы
- работает локально и оффлайн
- ставится за пару кликов
- без подписок и без облака
- отлично подходит для задач с готовым текстом (сократить/переформулировать)
Минусы
- встроенные модели не такие мощные, как облачные
- на русском бывают артефакты и галлюцинации
- скорость зависит от iPhone: на моём iPhone 16 Pro Max всё ок, но на более старых (например iPhone 12/13 и ниже) будет заметно медленнее
Если досмотрели (и дочитали) до конца — спасибо! Подписывайтесь на мой канал, и телеграм
и бусти!