9 месяцев назад
Парсинг для машинного обучения
Изначально парсинг был ручным и громоздким процессом, но благодаря технологическим достижениям он стал автоматизированным и сложным практическим навыком. Парсеры могут перемещаться по веб-сайтам, понимать их структуру и извлекать конкретную информацию на основе заранее определенных критериев...
279 читали · 2 года назад
Парсинг веб-страниц на Python
Парсинг веб-страниц Парсинг веб-страниц (scraping) нужен для многих целей: от борьбы с сервисами, которые не предоставляют API, до создания поисковых систем. Для демонстрации мы извлечем заголовки новостей с главной страницы журнала. C помощью библиотеки requests и парсера HTML BeautifulSoup мы можем сделать это всего в несколько строк. Установим библиотеки: pip3 install requests beautifulsoup4. Теперь откроем xakep.ru в отладчике браузера и увидим, что заголовки...