Gemini Browser Agent — это автоматизированный open-source инструмент, который связывает расширение Google Chrome с API Google Gemini. Этот агент использует модель Gemini 2.5 Computer Use для наблюдения за активной вкладкой, позволяя выполнять сложные, многоступенчатые задачи и автоматизировать действия в браузере. Он осуществляет обмен скриншотами и событиями с моделью, обеспечивая полноценный "зрительный" контроль веб-интерфейса. Проект предоставляет удобный способ автоматизации действий в браузере, позволяя пользователям легко интегрировать возможности искусственного интеллекта в свои рабочие процессы. * Визуальный контроль браузера: Агент использует снимки экрана активной вкладки, чтобы "видеть" и интерпретировать веб-страницу, имитируя человеческое восприятие. * Автоматическое выполнение действий: Модель генерирует и выполняет необходимые действия в браузере, включая клики мышью, ввод текста, прокрутку страницы и навигацию по ссылкам. * Решение сложных задач: Позволяет автоматизиро