Автор: Артемий Бочко, эксперт в области ИИ В 2025 году ИИ переходит от простых ответов на запросы к выполнению многошаговых задач. Например, системы вроде Zapier Agents и OpenAI Operator могут бронировать билеты, управлять календарями и взаимодействовать с веб-сервисами без постоянного контроля пользователя [2] [3]. Однако их внедрение сталкивается с проблемами: Модели GPT-4o (OpenAI), Claude 4 (Anthropic) и Gemini 2.5 Pro (Google) научились одновременно обрабатывать текст, изображения, аудио и видео. Например, GPT-4o анализирует скриншот приложения и предлагает инструкции по его использованию в реальном времени [6] [2]. Спрос на локальные LLM (например, Mistral NeMo, Qwen 2.5) растет из-за требований к безопасности данных. Их используют для обработки конфиденциальной информации, как в случае «упрощателя юридических документов» на базе Qwen [6].
Плюсы: контроль данных, кастомизация.
Минусы: требуют мощного железа и уступают облачным аналогам в сложных задачах [2]. Компании вроде Volvo