Добавить в корзинуПозвонить
Найти в Дзене
Цифровая Переплавка

Selenium для эпохи ИИ: создатель представляет Vibium

Создатель Selenium и Appium Jason Huggins представил новый проект — Vibium, который выглядит не как очередная обёртка над браузером, а как переосмысление всей идеи автоматизации веб-браузера (browser automation) под ИИ-агентов. Если Selenium был создан для людей, пишущих тесты, то Vibium — для агентов, которые думают, рассуждают и адаптируются. Selenium десятилетиями был стандартом де-факто, но у него есть системные проблемы: Даже появление WebDriver BiDi лишь частично решило эти проблемы — нужен был новый уровень абстракции. Vibium — это инфраструктура, а не просто библиотека. В центре системы — Clicker, единый Go-бинарник (~10 МБ), который: 🔑 Ключевая идея: браузер — это инструмент мышления агента, а не просто исполнитель команд. Vibium изначально спроектирован под ИИ: ИИ-агент не «дёргает DOM», а ведёт диалог с браузером: «Перейди на сайт → найди ссылку → если не получилось, попробуй иначе» Это радикально отличается от Selenium-подхода. Одна из самых сильных идей Vibium - самовосст
Оглавление

Создатель Selenium и Appium Jason Huggins представил новый проект — Vibium, который выглядит не как очередная обёртка над браузером, а как переосмысление всей идеи автоматизации веб-браузера (browser automation) под ИИ-агентов.

Если Selenium был создан для людей, пишущих тесты, то Vibium — для агентов, которые думают, рассуждают и адаптируются.

🚧 Почему классический Selenium перестал справляться

Selenium десятилетиями был стандартом де-факто, но у него есть системные проблемы:

  • 🔗 хрупкие локаторы (XPath / CSS ломаются от любого редизайна)
  • ⏳ постоянные sleep() и состояние гонки (race conditions)
  • 🧱 модель «команда → ответ», не подходящая для живого браузера
  • 🤖 крайне неудобен для LLM-агентов

Даже появление WebDriver BiDi лишь частично решило эти проблемы — нужен был новый уровень абстракции.

🧠 Что такое Vibium на самом деле

Vibium — это инфраструктура, а не просто библиотека.

В центре системы — Clicker, единый Go-бинарник (~10 МБ), который:

  • запускает и управляет Chrome
  • работает по WebDriver BiDi через WebSocket
  • поднимает MCP-сервер для ИИ-агентов
  • автоматически ждёт элементы (auto-wait)
  • умеет делать скриншоты и отслеживать состояние страницы
🔑 Ключевая идея: браузер — это инструмент мышления агента, а не просто исполнитель команд.

🧩 Архитектура нового поколения

Vibium изначально спроектирован под ИИ:

  • LLM (Claude, Gemini, локальные модели)
    ⬇ MCP (stdio)
  • Vibium Clicker
    ⬇ WebSocket BiDi
  • Chrome

ИИ-агент не «дёргает DOM», а ведёт диалог с браузером:

«Перейди на сайт → найди ссылку → если не получилось, попробуй иначе»

Это радикально отличается от Selenium-подхода.

🩺 Самолечение вместо падений

Одна из самых сильных идей Vibium - самовосстанавливающаяся архитектура:

  • ❌ элемент не найден
  • 🔄 система пробует альтернативные стратегии
  • 🧭 агент может сменить план действий
  • 📸 фиксируются скриншоты и контекст

В Selenium ошибка — это конец теста.
В Vibium ошибка — это
ветка рассуждений.

✍️ Тесты на человеческом языке

Для людей Vibium выглядит почти магически просто:

await vibe.go("https://example.com")
const link = await vibe.find("a")
await link.click()

А для ИИ — ещё проще:

“Go to example.com and click the first link”

Никаких драйверов, версий Chrome, ручной настройки окружения.

🤖 MCP — скрытый козырь проекта

Поддержка Model Context Protocol означает, что Vibium нативно встраивается в агентные IDE вроде Claude Code.

Фактически:

  • браузер становится ещё одним tool’ом агента
  • LLM сам решает, когда и зачем его использовать
  • тестирование превращается в рассуждение, а не сценарий

🚀 Почему это действительно важно

Vibium — это сигнал, что:

  • автоматизация браузера уходит от «скриптов» к агентам
  • тесты перестают быть жёсткими сценариями
  • QA, E2E и RPA начинают сливаться в одну дисциплину
  • Selenium-подход морально устаревает

Это не «Selenium 5».
Это
новая категория инструментов.

🔮 Личное мнение

Если Selenium был языком ассемблера для браузеров,
то Vibium — это
естественный язык взаимодействия.

И что особенно важно: проект делает это без магии, опираясь на:

  • WebDriver BiDi
  • WebSocket
  • MCP
  • чёткую инженерную архитектуру

Очень похоже на тот редкий момент, когда стандарт будущего рождается на наших глазах.

🔗 Источник:
https://github.com/VibiumDev/vibium