06:44
1,0×
00:00/06:44
622,4 тыс смотрели · 4 года назад
1 месяц назад
Парсинг данных с HeadHunter: Всестороннее руководство
В современном цифровом мире данные являются одним из самых ценных активов. Компании, которые умеют эффективно собирать, анализировать и использовать информацию, получают неоспоримое конкурентное преимущество. Одним из ключевых методов получения данных из открытых источников, таких как веб-сайты, является парсинг. Парсинг (от английского parsing — синтаксический анализ, разбор) — это процесс автоматизированного сбора и структурирования информации с веб-сайтов при помощи специальной программы, называемой парсером.1 Если представить веб-сайт как огромную библиотеку с тысячами книг на полках, то парсер — это ваш личный робот-библиотекарь...
Делимся опытом. Как парсить сайты, не опасаясь запрета доступа к данным
Парсинг сайтов — задача, к которой нужно подходить ответственно, — чтобы парсинг не оказывал негативного влияния на целевые сайты. Веб-сканеры, или автоматические сборщики данных во Всемирной паутине, могут извлекать данные гораздо быстрее и тщательнее людей, поэтому плохие методы парсинга могут в некоторой степени влиять на производительность сканируемого сайта. Хотя у большинства сайтов могут отсутствовать средства защиты от парсинга, некоторые из сайтов используют меры, препятствующие ему,...