Найти в Дзене
Craft Homelab

Мощный парсер MediaCrawler для популярных соцсетей

MediaCrawler – это универсальный инструмент для сбора открытых данных с крупнейших китайских соцплатформ: 小红书, 抖音, 快手, B站, 微博, 贴吧, 知乎 и других. Главное преимущество – обход сложных JS-сигнатур благодаря автологину через Playwright, что снижает технический порог. Проект поддерживает ключевые функции: поиск по хэштегам, сбор постов, комментариев, кеш логина и даже прокси-пулы для стабильности. Есть и визуальный WebUI для удобства. Проф версия с улучшенной архитектурой и новыми фичами, включая скачивание видео и масштабируемость, станет отличной школой для изучения построения больших парсеров. Это отличный пример как автоматизировать сбор данных с соцсетей без сложного реверса. #github #python #парсер #автоматизация #ai #webscraping #opensource #программирование https://github.com/NanmiCoder/MediaCrawler https://vlad1kudelko.github.io/

Мощный парсер MediaCrawler для популярных соцсетей

MediaCrawler – это универсальный инструмент для сбора открытых данных с крупнейших китайских соцплатформ: 小红书, 抖音, 快手, B站, 微博, 贴吧, 知乎 и других. Главное преимущество – обход сложных JS-сигнатур благодаря автологину через Playwright, что снижает технический порог. Проект поддерживает ключевые функции: поиск по хэштегам, сбор постов, комментариев, кеш логина и даже прокси-пулы для стабильности. Есть и визуальный WebUI для удобства. Проф версия с улучшенной архитектурой и новыми фичами, включая скачивание видео и масштабируемость, станет отличной школой для изучения построения больших парсеров. Это отличный пример как автоматизировать сбор данных с соцсетей без сложного реверса.

#github #python #парсер #автоматизация #ai #webscraping #opensource #программирование

https://github.com/NanmiCoder/MediaCrawler

https://vlad1kudelko.github.io/