39 подписчиков

Вместо Chrome MCP (агент управляет браузером) — Playwright

25 марта25 мар

3 мин

Это библиотека для автоматизации браузера, которая работает напрямую на машине пользователя. Разница огромная: Доступ к сети: · Chrome MCP → заблокирован · Playwright → полный Сохранение файлов: · Chrome MCP → через AI, медленно · Playwright → напрямую на диск Параллельность: · Chrome MCP → невозможна · Playwright → сколько угодно потоков Скорость (1 курс): · Chrome MCP → 1-3 часа · Playwright → 10-20 минут ——— ФАЗА 6. Архитектура, которую можно переиспользовать Выстроили трёхэтапный pipeline: 1. Извлечение — Playwright скачивает субтитры параллельно для всех 7 курсов сразу 2. Конвертация — чистый Python преобразует данные в markdown-файлы 3. Интеллект — Claude Code генерирует summary и описания Важный принцип: AI не занимается тяжёлой работой (HTTP-запросы, парсинг, сохранение файлов). Это делают детерминированные скрипты. AI добавляет ценность там, где нужен именно "интеллект" — понять текст, выделить главное, написать описание. Весь код и инструкции упакованы в одну папку — с

Вместо Chrome MCP (агент управляет браузером) — Playwright. Это библиотека для автоматизации браузера, которая работает напрямую на машине пользователя. Разница огромная:

Доступ к сети:

· Chrome MCP → заблокирован

· Playwright → полный

Сохранение файлов:

· Chrome MCP → через AI, медленно

· Playwright → напрямую на диск

Параллельность:

· Chrome MCP → невозможна

· Playwright → сколько угодно потоков

Скорость (1 курс):

· Chrome MCP → 1-3 часа

· Playwright → 10-20 минут

———

ФАЗА 6. Архитектура, которую можно переиспользовать

Выстроили трёхэтапный pipeline:

1. Извлечение — Playwright скачивает субтитры параллельно для всех 7 курсов сразу

2. Конвертация — чистый Python преобразует данные в markdown-файлы

3. Интеллект — Claude Code генерирует summary и описания

Важный принцип: AI не занимается тяжёлой работой (HTTP-запросы, парсинг, сохранение файлов). Это делают детерминированные скрипты. AI добавляет ценность там, где нужен именно "интеллект" — понять текст, выделить главное, написать описание.

Весь код и инструкции упакованы в одну папку — скопировал, запустил, работает. Это называется отчуждаемость: любой может повторить, не разбираясь в том, как это строилось.

———

ИТОГ В ЦИФРАХ

Начало Финал

Подход Ручной, Автоматический

один за раз. параллельный,

Время. 1-3 часа 10-20 минут

на 1 курс

Время. До 20 часов 30-60 минут

на 7 курсов

Передача Через AI. Напрямую на диск

данных ненадёжно

———

ТРИ УРОКА, КОТОРЫЕ ОСТАЮТСЯ

1. Sandbox — это и защита, и клетка. Изоляция AI-агента нужна для безопасности, но она создаёт узкое место для задач с большими объёмами данных. Важно понимать, где находятся эти границы.

2. Правильный уровень абстракции решает всё. Управление браузером через AI — отличный инструмент для интерактивной работы. Но для batch-обработки 75 видео — это неправильный инструмент. Playwright на уровне ОС — правильный. Знать, когда переключиться — важнее, чем оптимизировать неподходящий подход.

3. Разделяй интеллект и исполнение. AI не должен быть конвейером для данных. Он должен быть оркестратором: давать команды, принимать решения, генерировать смысл. Механическую работу пусть делают скрипты.

———

Весь этот путь — от ручного кликания до параллельной автоматизации — занял примерно столько же времени, сколько сэкономил. Но протокол теперь есть. И следующие 400 лекций займут час.

Самое интересное.

1. По большому счету, эта технология может подходить для того, чтобы в том числе проходить такие экзамены за человека.

2. Мы создаем технологию, которая позволяет разумно и достаточно эффективно взаимодействовать с любой системой интерактивно, добиваться какого-то результата. Начиная с парсинга и заканчивая тем, что можно совершать покупки на Амазоне, в том числе и проходить экзамены, потому что экзамен — это просто разновидность коммуникации.

3. Мы собрали универсальный паттерн: LLM как оркестратор + Playwright как руки для взаимодействия с любым веб-интерфейсом + детерминированные скрипты для тяжёлой работы. Это действительно применимо к любой системе, с которой можно взаимодействовать через браузер — будь то образовательная платформа, маркетплейс или государственный портал.

По сути это программный агент общего назначения с разделением на три слоя: интеллект (LLM), действия (Playwright), и протокол (документированная методика). Именно третий слой — протокол — делает это переиспользуемым. Без него каждая новая задача начинается с нуля.

4. По большому счету, это система хакинга в изначальном, инженерном смысле слова. Не взлом, а глубокое понимание того, как система работает, и создание способа взаимодействия с ней на программном уровне.

Любой веб-сервис рассчитан на человека с браузером — мы просто заменили человека на связку LLM + Playwright, сохранив тот же интерфейс взаимодействия.

Гаджеты и электроника

5,73 млн интересуются