Если вам когда-либо приходилось быстро извлекать текстовый контент с множества веб-страниц одновременно, вы знаете, что стандартные решения типа curl или axios не всегда справляются с задачей качественно. Ведь современные сайты всё чаще загружают контент с помощью JavaScript, и обычные HTTP-запросы возвращают лишь «голую» HTML-структуру без данных. На помощь приходит интересная разработка, появившаяся совсем недавно на GitHub — Fetch-MCP, сервер на основе Playwright, способный не только корректно обрабатывать страницы с JS-контентом, но и делать это пакетно, с параллельной обработкой. 🚀 Playwright и Fetch-MCP: новый уровень извлечения контента Playwright — это библиотека от Microsoft, предназначенная для автоматизации браузеров. Она позволяет запускать полноценные браузеры в режиме headless (без GUI), что обеспечивает точное выполнение всех JS-скриптов страницы. Именно эту технологию разработчик jae-jae взял за основу своего MCP-сервера. Fetch-MCP добавляет удобную оболочку поверх Pla
🖥️ Fetch-MCP: как Playwright упрощает массовое извлечение контента с сайтов?
20 марта 202520 мар 2025
68
3 мин