11 месяцев назад
Программирование на языке Python. Парсинг html-страниц с помощью стандартного модуля html.parser
Доброго времени суток, читатели, зрители моего канала programmer's notes. Не забывайте подписываться и писать свои комментарии к моим статьям и видео. Парсинг страниц html с помощью модуля html.parser Для парсинга web-страниц есть разные библиотеки. И мы будем к ним обращаться. Но есть и совершенно замечательный стандартный модуль html.parser. Вот сегодня мы им и займёмся. Чтобы разбирать html-страницу, необходимо создать объект класса HTMLParser. У него есть целый набор методов, часть из которых запускается автоматически при отправке объекту текста html-страницы...
9 месяцев назад
30 лучших инструментов для парсинга: от библиотек до готовых программ
Парсинг (также называемый извлечением данных из сети или сбором данных с веб-сайтов) представляет собой технику извлечения данных с веб-сайтов. Он преобразует веб-данные, разбросанные по страницам, в структурированные данные, которые можно сохранить на локальном компьютере в виде электронной таблицы или передать в базу данных. Для людей, не разбирающихся в программировании, создание парсера может быть сложной задачей. К счастью, существует программное обеспечение для сбора данных, предназначенное как для лиц с программированием, так и для тех, кто не обладает такими навыками...