Парсинг – процесс, к которому прибегают в информационных технологиях. Он подразумевает чтение и анализ данных. Простыми словами, это когда программа «читает» текст и «понимает» его содержание. Так, автоматизируются многие задачи: от сортировки информации до её извлечения. Парсер – это инструмент, выполняющий эту работу.
Сам термин «парсинг» пришел из английского языка. Однако его суть легко понять каждому. Представьте, что вы читаете книгу и выписываете все важные моменты. Парсер делает то же самое, только быстрее и с данными из интернета, файлов или документов...
Парсинг – это сбор информации из открытых источников в интернете для дальнейшего копирования, аналитики, обработки. Для этого используются специальные программы и язык XPath. ЗАЧЕМ ЭТО НУЖНО? Благодаря способности быстро обрабатывать огромные объемы, программы используются для: Кроме того, можно собирать резюме. ПРЕИМУЩЕСТВА ПАРСИНГА Процесс имеет ряд преимуществ: Но помимо достоинств есть и недостатки. Это защита некоторых веб страниц от парсеров. С них получить полноценную и достоверную инфу невозможно...