Добавить в корзинуПозвонить
Найти в Дзене
NEURO-AI

OpenClaw 2026.4.24: ИИ-агент теперь слышит вас в Google Meet и отвечает голосом

Раньше OpenClaw работал с текстовыми каналами - мессенджерами, чатами, API. Теперь агент умеет физически присутствовать в Google Meet: подключается к конференции по URL, слушает и отвечает голосом в реальном времени. Это реализовано через встроенный плагин с личной авторизацией Google и поддержкой двух транспортных слоёв - Chrome и Twilio. Для тех, кто работает в нестандартных конфигурациях: есть поддержка paired-node, то есть возможность запустить браузерный узел отдельно от основного шлюза как это нужно, например, при использовании Parallels с macOS. После встречи агент сохраняет артефакты: записи, транскрипты, умные заметки, список участников. Отдельный инструмент - восстановление уже открытых вкладок Meet без запуска дублирующей сессии. Подбор функций говорит сам за себя: Google Meet идёт туда, где есть живые деловые встречи и нужна их документация. Агент превращается из текстового помощника в участника рабочих процессов, которые до этого требовали присутствия человека. Параллельно
Оглавление

Google Meet как полноценный участник встречи

Раньше OpenClaw работал с текстовыми каналами - мессенджерами, чатами, API. Теперь агент умеет физически присутствовать в Google Meet: подключается к конференции по URL, слушает и отвечает голосом в реальном времени. Это реализовано через встроенный плагин с личной авторизацией Google и поддержкой двух транспортных слоёв - Chrome и Twilio.

Для тех, кто работает в нестандартных конфигурациях: есть поддержка paired-node, то есть возможность запустить браузерный узел отдельно от основного шлюза как это нужно, например, при использовании Parallels с macOS. После встречи агент сохраняет артефакты: записи, транскрипты, умные заметки, список участников. Отдельный инструмент - восстановление уже открытых вкладок Meet без запуска дублирующей сессии.

Подбор функций говорит сам за себя: Google Meet идёт туда, где есть живые деловые встречи и нужна их документация. Агент превращается из текстового помощника в участника рабочих процессов, которые до этого требовали присутствия человека.

Голосовые петли с доступом к полному агенту

Параллельно с плагином Google Meet появились так называемые realtime voice loops - голосовые петли в реальном времени для Talk, Voice Call и Meet. Смысл в следующем: во время живого звонка агент может не просто отвечать по заранее написанным скриптам, а обращаться ко всему своему инструментарию, то есть выполнять задачи, обращаться к внешним сервисам, делать поиск.

Техническая сторона: в Talk и браузерном интерфейсе голосовые сессии теперь строятся на WebRTC с поддержкой OpenAI Realtime. Google Gemini Live добавлен как альтернативный провайдер с двусторонним аудио и поддержкой функциональных вызовов. Голосовые звонки через Voice Call тоже получили тот же инструмент агентных обращений, что и Meet.

Это разрыв с привычной схемой, где голосовые боты работают по отдельному, упрощённому стеку. Здесь голос и логика агента - одно целое.

DeepSeek V4 Flash и V4 Pro в каталоге

Оба варианта DeepSeek V4 теперь входят в стандартный каталог OpenClaw. V4 Flash установлен как модель по умолчанию при первичной настройке - быстрый и лёгкий, ориентирован на рутинные задачи с минимальными затратами. V4 Pro предназначен для сценариев, где нужна более глубокая обработка.

Вдобавок исправлено поведение DeepSeek при цепочках инструментальных вызовов с режимом «thinking» (расширенным размышлением): ответы в продолжающихся диалогах теперь корректно воспроизводятся. До этого replay-сессии ломались на follow-up запросах.

Браузерная автоматизация: точнее и надёжнее

Браузерный агент в этом релизе получил покоординатные клики. Теперь можно взаимодействовать с элементами страницы не только через дерево доступности, но и по точным экранным координатам. Добавлен fallback-механизм через CDP (Chrome DevTools Protocol) с поддержкой iframe-ссылок, что делает сценарии с вложенными фреймами более стабильными.

Среди практических улучшений: увеличено время по умолчанию для выполнения сложных сценариев, улучшено переиспользование и восстановление вкладок, добавлена команда openclaw browser doctor --deep

для диагностики живого состояния браузера. Отдельная настройка - повышенные таймауты для медленных хостов типа Raspberry Pi.

Инфраструктура: легче, чище, без накопившегося мусора

Внутри произошло несколько важных, хотя и менее заметных изменений. Каталог моделей теперь загружается статически, а зависимости провайдеров - лениво, только когда нужны. Это ускоряет старт шлюза и снижает потребление ресурсов при запуске.

Исправлена утечка дочерних процессов: при многократных скриптовых запусках через CLI дочерние MCP-процессы (протокол для подключения внешних инструментов) больше не накапливаются в фоне. Для образной генерации через OpenAI Codex устранена проблема с устаревшими базовыми URL-адресами, которые при определённых конфигурациях отправляли запросы не туда.

Проверочная точка - следующие месяцы

OpenClaw последовательно движется от мессенджерного шлюза к полноценному агенту, способному работать в голосовых и видеоконференциях. Пока это выглядит убедительно на уровне архитектуры. Практический вопрос - насколько стабильно голосовые сессии с агентными консультациями будут работать в реальных нагрузках, а не в управляемых условиях. Если команда удержит качество на расширяющемся наборе каналов, следующие релизы покажут, стал ли Meet-плагин рабочим инструментом или красивым демо.