Добавить в корзинуПозвонить
Найти в Дзене
Social Mebia Systems

Почему телефон с супер-агентом стал хитом

В декабре 2025 года технологическое сообщество обсуждает не очередной флагман от гигантов, а инженерный образец смартфона с интегрированным AI-ассистентом «豆包» (Doubao) от ByteDance. Этот аппарат, оснащённый системным агентом нового поколения, вызвал ажиотаж: на маркетплейсах его цена взлетела до 5000 юаней, а обсуждения не утихают ни в профессиональных чатах, ни в СМИ. В чём уникальность Doubao-агента? В отличие от привычных AI-ассистентов, существующих как отдельные приложения, Doubao встроен в саму операционную систему. Это не просто помощник, а настоящий «супер-агент», способный выполнять сложные цепочки действий через разные приложения — от заказа еды до бронирования билетов и составления маршрутов. Всё это — по одной голосовой команде, без ручного переключения между приложениями. Эксперты отмечают: Doubao не просто расширяет возможности смартфона, а меняет саму парадигму взаимодействия с устройством. Теперь AI не просто подсказывает, а действует вместо пользователя, координируя

В декабре 2025 года технологическое сообщество обсуждает не очередной флагман от гигантов, а инженерный образец смартфона с интегрированным AI-ассистентом «豆包» (Doubao) от ByteDance. Этот аппарат, оснащённый системным агентом нового поколения, вызвал ажиотаж: на маркетплейсах его цена взлетела до 5000 юаней, а обсуждения не утихают ни в профессиональных чатах, ни в СМИ.

В чём уникальность Doubao-агента?

В отличие от привычных AI-ассистентов, существующих как отдельные приложения, Doubao встроен в саму операционную систему. Это не просто помощник, а настоящий «супер-агент», способный выполнять сложные цепочки действий через разные приложения — от заказа еды до бронирования билетов и составления маршрутов. Всё это — по одной голосовой команде, без ручного переключения между приложениями.

Эксперты отмечают: Doubao не просто расширяет возможности смартфона, а меняет саму парадигму взаимодействия с устройством. Теперь AI не просто подсказывает, а действует вместо пользователя, координируя работу разных сервисов и приложений.

Почему создать системного агента так сложно?

AI-агент, способный управлять смартфоном на уровне системы, сталкивается с четырьмя ключевыми вызовами:

  1. Восприятие: агент должен мгновенно распознавать все элементы интерфейса (кнопки, иконки, текстовые поля), отличать важное от визуального «шума» (рекламы, всплывающие окна), понимать смысл каждого элемента.
  2. Планирование: для выполнения сложных задач агенту нужно помнить контекст, переключаться между приложениями, справляться с ошибками (например, разрыв соединения, неожиданные запросы разрешений), корректировать свои действия на лету.
  3. Принятие решений: агент должен уметь работать не только с привычными интерфейсами, но и с новыми, незнакомыми приложениями, выполнять сложные действия (долгое нажатие, свайпы, масштабирование), быстро реагировать на обратную связь.
  4. Системные ограничения: высокая скорость реакции, работа в условиях ограниченных прав доступа, обеспечение безопасности данных и приватности пользователя.

Преодолеть эти барьеры — задача не только для инженеров, но и для исследователей в области AI, интерфейсов и мобильных ОС.

Как Doubao решает эти задачи?

Doubao-агент сочетает глубокую интеграцию с Android (получая системные права только с согласия пользователя) и мощные визуальные AI-модели. Он анализирует экран, понимает, что происходит, и сам решает, куда кликнуть, что ввести, в какое приложение перейти. По словам экспертов, это «призрачный палец + мозг + система принятия решений» в одном флаконе.

Важное отличие — Doubao не просто автоматизирует сценарии, а способен к обобщению: он работает с разными приложениями, понимает пользовательский контекст, может выполнять длинные цепочки задач без сбоев. Такой уровень универсальности и стабильности ранее был недостижим для мобильных AI-ассистентов.

Технологическая основа: UI-TARS

В основе Doubao лежит собственная система ByteDance — UI-TARS, которая с 2025 года активно развивается и уже стала отраслевым стандартом для системных GUI-агентов. UI-TARS — это не просто модель, а целая экосистема:

  • Data Flywheel: механизм постоянного самосовершенствования через генерацию и фильтрацию новых данных для обучения.
  • Многоуровневое обучение с подкреплением: агент учится на длинных сценариях, анализируя свои успехи и ошибки, что позволяет ему справляться с реальными, сложными задачами.
  • Гибридная среда: агент может не только кликать по интерфейсу, но и работать с файловой системой, терминалом, внешними инструментами — как настоящий пользователь.
  • Масштабируемая инфраструктура: для обучения и тестирования используются виртуальные среды, что позволяет быстро и безопасно отрабатывать миллионы сценариев.

UI-TARS позволяет агенту видеть экран, понимать его, принимать решения и действовать — всё это максимально похоже на поведение реального человека.

Мнение экспертов

AI-исследователи отмечают, что Doubao и UI-TARS задали новую планку для системных агентов:

  • Лю Бан (Университет Монреаля, MILA): UI-TARS-2 — это проверенная, масштабируемая архитектура, которая впервые позволяет AI-агенту универсально управлять графическим интерфейсом, опираясь только на визуальное восприятие.
  • Чжан Чи (Westlake University): ByteDance делает ставку не на архитектурные изыски, а на масштаб данных и вычислений, что даёт реальный прирост качества в реальных задачах.
  • Чжан Вэйнан (Шанхайский университет транспорта): UI-TARS — это не только технологический прорыв, но и чёткая дорожная карта для всей индустрии системных агентов.
  • Шэнь Юнлян (Чжэцзянский университет): UI-TARS показал, что чисто визуальный подход, подкреплённый масштабным обучением и виртуальными средами, способен к саморазвитию и постоянному росту эффективности.

Что это значит для будущего смартфонов?

Doubao-подобные агенты — это не просто новая функция, а шаг к радикально новому типу взаимодействия с устройствами. В будущем пользователь будет не искать нужный сервис, а просто формулировать задачу — и агент сам найдёт способ её решить, взаимодействуя с нужными приложениями и сервисами.

Смартфон перестанет быть набором иконок и превратится в «интеллектуального партнёра», который понимает ваши намерения и действует в ваших интересах. Операционная система станет не просто диспетчером ресурсов, а настоящим координатором ваших цифровых задач.

Вызовы и перспективы

Путь к массовому внедрению системных агентов ещё не завершён. Остаются вопросы вычислительных ресурсов, безопасности, совместимости, а также — насколько быстро пользователи привыкнут к новому формату взаимодействия.

Но уже сейчас ясно: системные GUI-агенты, такие как Doubao, открывают новую эру мобильных устройств, где AI становится не дополнением, а ядром пользовательского опыта. И, возможно, именно с таких решений начнётся переход к по-настоящему «умным» телефонам, которые действуют не по команде, а по вашему намерению.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/