OpenOmniBot - бесплатный ИИ-агент для Android с открытым кодом
Допустим, вам нужно поставить оценку ресторану в приложении, скачать видео из соцсети или завести будильник голосом. Обычно это три разных приложения, десяток нажатий и пара минут жизни. А теперь представьте: вы пишете одно сообщение - и телефон всё делает сам. Открывает нужное приложение, находит кнопки, тыкает, вводит текст, листает экран.
Это не фантазия и не рекламный ролик Google. Это OpenOmniBot - программа с открытым кодом от китайской компании 万象智维. Проект развивается быстро: за несколько недель вышло 24 релиза, сейчас актуальная версия - 0.2.5. Готовый файл для установки можно скачать прямо со страницы проекта.
Не чат-бот, а исполнитель
Большинство ИИ-помощников на телефоне - это окно для переписки. Спросил - получил текстовый ответ. OpenOmniBot работает по-другому. Он подключается к системе специальных возможностей Android - той самой, которая помогает людям со слабым зрением пользоваться телефоном. Через неё программа видит экран, распознаёт элементы интерфейса и управляет ими: нажимает, прокручивает, вводит текст.
На странице проекта есть видеодемонстрации. В одной - агент сам скачивает видео из приложения по ссылке. В другой - выполняет многошаговую задачу в стороннем приложении. Меня это озадачило: программа берёт и управляет другими приложениями, как будто кто-то водит пальцем по экрану.
OpenOmniBot запоминает и действует по расписанию
У программы есть система памяти - краткосрочная и долгосрочная. Агент учитывает ваши привычки и предпочтения при выполнении задач.
Расписание - отдельная сильная сторона. Агент умеет запускать задачи по таймеру: например, каждое утро собирать прогноз погоды и свежие новости и присылать уведомление. На странице проекта есть отдельная демонстрация этой возможности. Звучит как платный сервис, а на деле - бесплатное приложение.
Терминал, браузер и расширения
OpenOmniBot не ограничивается нажатием кнопок на экране. Внутри - встроенная среда Alpine, которая превращает телефон в мини-компьютер с командной строкой. Через неё агент выполняет системные задачи, работает с файлами, запускает скрипты.
Программа поддерживает MCP - стандарт, через который ИИ-приложения подключаются к внешним инструментам и сервисам. Есть система навыков (Skills): готовые сценарии для типовых задач, которые можно добавлять и настраивать. Набор возможностей растёт, не требуя переустановки самого приложения.
Где OpenOmniBot пока буксует
Интерфейс и документация - на китайском. Для человека без знания языка навигация будет непростой, хотя сам чат с агентом работает на любом языке, который поддерживает подключённая нейросеть.
Проект молодой. 24 релиза за несколько недель - это одновременно и хорошо (активная разработка), и настораживает (стабильность пока под вопросом). Приложение требует настройки: нужно указать провайдера нейросети, модель, подключить инструменты. «Скачал и забыл» здесь не сработает.
И главное: вы даёте программе доступ к управлению экраном и специальным возможностям. Код открыт, его можно проверить - но сам факт таких разрешений требует осознанного решения.
Зачем это важно уже сейчас
Google и Samsung встраивают похожие агентные функции в Android 17 и оболочку Galaxy. Разница: их решения привязаны к конкретным устройствам и облачным сервисам. OpenOmniBot - попытка сделать то же самое без привязки к корпорации. Код открыт, провайдера нейросети выбираете сами.
Мне кажется, через пару лет управление телефоном текстовыми командами станет таким же обычным, как голосовые помощники. И пока корпорации будут решать, сколько брать за подписку, проекты вроде OpenOmniBot двигают эту идею вперёд бесплатно. 24 обновления за считаные недели - темп, который редко увидишь даже у коммерческих продуктов.
А вы бы доверили ИИ самостоятельно нажимать кнопки на вашем телефоне - или это слишком?
Источник: OpenOmniBot
🔔 КликХак нашёл программу, которая управляет вашим телефоном. Подпишитесь - вдруг следующая находка будет управлять вашим холодильником.