Артур Хорошев про автоматизацию и нейросети

3273 подписчика

Автоматизация браузера в 2026: связка Make.com и Chrome API

11 марта11 мар

8 мин

Автоматизация браузера через связку Chrome API и облачных платформ — это окончательный отказ от хрупких скриптов в пользу гибридных систем, где браузер собирает сырые данные, а ИИ-агенты принимают логические решения. Это превращает любой неструктурированный сайт в надежный источник данных через вебхуки. Результат — экономия десятков часов рутины без необходимости писать сложный код парсеров. Ну вот смотрите. Еще пару лет назад я стабильно тратил свои выходные на то, чтобы переписывать XPath-селекторы в скриптах. Дизайнер на сайте поменял кнопку местами, выкатили новый фронтенд — и всё, вся автоматизация работы браузера летит в трубу. Скрипты падают, клиенты нервничают. Бесило страшно. В феврале 2026 года рынок наконец-то перестроился. Классическая программа автоматизации браузер больше не нужна в ее старом понимании. С полным переходом Google на стандарт Manifest V3 (MV3) мы получили шикарную вещь: теперь браузер может напрямую, безопасно и очень быстро пулять JSON-пакеты в ваши сценар

Оглавление

Архитектура 2026 года: Manifest V3 и Service Workers
Vibe Coding: создаем кастомные коннекторы чужими руками
ИИ-агенты берут управление логикой на себя

Ну вот смотрите. Еще пару лет назад я стабильно тратил свои выходные на то, чтобы переписывать XPath-селекторы в скриптах. Дизайнер на сайте поменял кнопку местами, выкатили новый фронтенд — и всё, вся автоматизация работы браузера летит в трубу. Скрипты падают, клиенты нервничают. Бесило страшно.

В феврале 2026 года рынок наконец-то перестроился. Классическая программа автоматизации браузер больше не нужна в ее старом понимании. С полным переходом Google на стандарт Manifest V3 (MV3) мы получили шикарную вещь: теперь браузер может напрямую, безопасно и очень быстро пулять JSON-пакеты в ваши сценарии. Хрупкие боты умерли, да здравствует гиперавтоматизация, управляемая нейросетями.

Архитектура 2026 года: Manifest V3 и Service Workers

Тут важный момент. Эра Manifest V3 заставила разработчиков полностью переписать все расширения автоматизации браузера. Устаревшие фоновые страницы окончательно убиты, на их место пришли Service Workers и declarativeNetRequest.

Что это значит на практике? Передача данных через api google chrome стала в разы быстрее и безопаснее. Мы больше не парсим страницу целиком в поисках одного нужного тега. Мы вытягиваем конкретные элементы через chrome extension api и мгновенно отправляем их на вебхук. Это работает даже на тяжелых сайтах типа бесконечных лент в соцсетях.

Типичная ошибка новичков — пытаться использовать старые коннекторы из 2023 или 2024 года. Они просто не запускаются, выдавая бесконечный chrome api error в консоли разработчика, потому что старые методы работы с сетью заблокированы.

Моя рекомендация: используйте только свежие расширения с поддержкой MV3. Тот же Webhook Manager версии 2.1 идеально цепляется к DOM-дереву. Вы просто кликаете по нужному блоку на странице, и он превращает этот клик в готовый API-запрос на ваш сервер.

Vibe Coding: создаем кастомные коннекторы чужими руками

Зачем вообще искать готовые решения в магазине расширений, если можно сделать свое за пять минут? Главный тренд этого года — vibe coding. Вы открываете Claude 4.6 (версия Sonnet сейчас пишет код лучше всех) или свежий DeepSeek V4 и просто просите написать расширение под вашу конкретную задачу.

Оно будет собирать, например, контакты с профиля LinkedIn или свежие посты из Reddit, и по кнопке отправлять их дальше по цепочке. Никакая тяжеловесная автоматизация действий в браузере боты тут не нужна — скрипт весит пару килобайт.

Кстати, я автоматизировал сбор квалифицированных заявок из закрытых отраслевых форумов через Make.com — конверсия в ответ выросла на 35%, а времени на ручной перенос данных уходит ноль. Если интересна автоматизация — вот реф-ссылка: https://www.make.com/en/register?pc=horosheff

Честно говоря, я вообще перестал писать фронтенд-код руками для таких задач. Нейронка выдает готовый код, я закидываю папку в режим разработчика Chrome, и всё работает. Единственный подводный камень — нужно четко прописать ИИ, чтобы он использовал актуальные методы chrome windows api для работы с фокусными окнами, иначе фоновые скрипты уснут при сворачивании браузера.

ИИ-агенты берут управление логикой на себя

В начале 2026 года облачные платформы автоматизации выкатили киллер-фичу — AI Agents с панелью рассуждений (Reasoning Panel). Теперь настройка make — это не просто построение линейного скрипта шаг за шагом.

Сценарий такой: вы выделяете текст… нет, даже проще — просто кликаете по иконке расширения на странице. Инструмент кидает контент через chrome flags prompt api for gemini nano (или любую другую локальную/облачную модель) на сервер. Там ИИ-агент сам анализирует текст, понимает контекст и решает, куда это положить — в CRM, обновить строку в Google Таблице или сразу сгенерировать драфт ответа через claude chrome api.

Хотите научиться автоматизации рабочих процессов с помощью сервиса make.com и нейросетей ? Подпишитесь на наш https://t.me/maya_pro

Абсолютно не рекомендую делать таких агентов полностью автономными черными ящиками. По закрытой статистике продакт-менеджеров, ИИ без заданных рамок успешно завершает менее 2.5% сложных бизнес-задач. Оставляйте нейросетям распознавание неструктурированного контента со страницы, а бизнес-логику жестко прописывайте визуальными модулями. Это гарантирует предсказуемый результат.

Обучение автоматизации на Make.com

Обход антифрод-систем и Headless-режим

Иногда банальные вебхуки и расширения не спасают, если нужный вам сайт агрессивно защищен от парсинга (привет, крупные маркетплейсы). Тут в игру вступает тяжелая артиллерия — автоматизация браузера на python с использованием Playwright и эволюционировавшего протокола WebDriver BiDi.

В этом случае мы запускаем невидимый браузер на удаленном сервере, а управляется эта автоматизация действий в браузере через HTTP-запросы из нашего основного сценария. Мы обходим 99% капч, потому что система ведет себя как реальный пользователь.

Чтобы не мучиться с развертыванием инфраструктуры, я использую https://mcp-kv.ru/ MCP-сервис «Всё подключено» — там Wordstat, WordPress, ВКонтакте, Telegram, генерация картинок и другие API собраны в одном месте. Это экономит массу времени на поддержке серверов.

Главная ошибка здесь — использовать голые скрипты со стандартными юзер-агентами. Забанят моментально. Мой совет: всегда проксируйте запросы и используйте инструменты для подмены отпечатков браузера. Антифрод в 2026 году легко вычисляет ленивых инженеров.

Динамические сайты и визуальный скрапинг

Если нужный вам ресурс написан на тяжелом React или Vue, и классы элементов там генерируются заново при каждой перезагрузке страницы — забудьте про привязку к селекторам. Это прямой путь к нервному срыву.

Сегодня автоматизация действий в браузере расширение типа Browse AI делает иначе: оно использует визуальный скрапинг. Мы передаем в платформу сырой текст страницы или её скриншот. Дальше в работу включаются мультимодальные модели, такие как ChatGPT-5.4 или YandexGPT 4 Enterprise.

Обожаю этот подход. Если дизайн сайта поменялся — ну, то есть перерисовали вообще всё — нейросеть всё равно найдет нужные цены, имена и контакты просто на картинке. По статистике, такой подход в 3 раза снижает частоту поломок интеграций по сравнению с чистым Selenium.

Кстати, для генерации превьюшек к таким собранным базам данных я активно юзаю Nano Banano 2. А если нужно вытянуть обложки или сформировать товарные фиды, можно https://github.com/Horosheff/Tilda-AI-Agent-Feeds Tilda AI Agent (скачать) — отлично интегрируется в общую цепочку.

Безопасность и локальное хранение ключей

Последнее, но критически важное. Privacy-first архитектура в 2026 году — это жесткий технический стандарт. Политики магазинов расширений закрутили гайки до предела.

Раньше токены и секретные ключи валялись в коде где попало. Теперь все адекватные коннекторы хранят API-ключи и URL-адреса вебхуков исключительно в Local Storage браузера пользователя. Данные больше не проходят через транзитные серверы разработчиков расширений.

Если вы скачали или сгенерировали скрипт, который просит отправить собранную информацию на какой-то левый домен перед тем, как переслать её в ваш сценарий — сносите его немедленно.

Я всегда открываю вкладку Network в консоли браузера при тестировании новых связок. JSON-пакет должен уходить из Chrome напрямую в ваш защищенный вебхук. Строго без посредников.

Что делать дальше

Резюмируем. Хватит писать падающие парсеры по технологиям нулевых годов. Вот ваш четкий план действий:

Откройте топовую LLM модель для генерации кода
Сформулируйте задачу на создание простого MV3-расширения под конкретный сайт
Настройте принимающий вебхук в вашей платформе автоматизации
Передайте извлеченный сырой текст встроенным ИИ-модулям для структурирования
Запишите готовый результат в базу данных или CRM

Если хочешь разобраться глубже в автоматизации — у меня есть обучение: https://kv-ai.ru/obuchenie-po-make Обучение по Автоматизации, CursorAI, маркетингу.

https://max.ru/maya_pro Мы в MAX

https://kv-ai.ru/blyuprinty-make-com-podpiska Блюпринты по подписке

Частые вопросы

Можно ли автоматизировать выгрузку документов через chrome pdf api?

Да, актуальные методы позволяют генерировать и сохранять PDF-файлы напрямую из фоновых скриптов без вызова визуального диалога печати. Это идеально подходит для массовой генерации счетов или отчетов прямо из CRM-системы.

Как происходит make sky blue версия 123 настройка для новичков?

В обновленной версии интерфейса Sky Blue (сборка 123) появился упрощенный визуальный маппинг. Вам достаточно мышкой перетащить входящие JSON-переменные из вебхука браузера в нужные поля целевых модулей без написания сложных формул.

Подходит ли автоматизация работы браузера для обхода капчи?

Напрямую через легковесные расширения — нет, это неэффективно и ведет к блокировкам. Для решения сложных капч лучше использовать сторонние сервисы, которые интегрируются в ваш сценарий через отдельные HTTP-запросы.

Чем отличаются расширения автоматизации браузера от десктопных RPA?

Расширения работают исключительно внутри песочницы Chrome и ограничены его безопасным API, что делает их быстрыми и кроссплатформенными. Десктопные RPA-системы контролируют всю операционную систему, но требуют значительно больше ресурсов на поддержку и обновление.

Живы ли еще автоматизация браузера боты на базе старого Selenium?

В энтерпрайз-сегменте для поддержки устаревших корпоративных систем они еще встречаются. Однако для задач современного маркетинга, лидогенерации и нетворкинга они безнадежно устарели из-за низкой скорости работы и высокой вероятности блокировки антифрод-фильтрами.

Можно ли использовать claude chrome api для написания комментариев в соцсетях?

Технически да, вы можете настроить связку, где расширение забирает текст поста, отправляет в модель Claude 4.6, и возвращает готовый ответ в поле ввода. Главное — сохранять ваш личный стиль и контекст в промпте, чтобы комментарии не выглядели синтетическими.

Технологии в финансах

65 тыс интересуются