Доброго времени суток, читатели, зрители моего канала programmer's notes. Не забывайте подписываться и писать свои комментарии к моим статьям и видео. И, конечно, не забывайте о лайках. Пример парсинга страницы https://en.wikipedia.org (urllib.request и html.parser) Сегодня приведу простой пример парсинга реальной Интернет-страницы. Для этого следует вспомнить о urllib.request и html.parser. Ну и если забыли стандартную работу с файлами, посмотрите здесь, здесь и здесь. Как и ранее мы переопределяем некоторые методы класса HTMLParser, объект которого обрабатывает html-страницу. Если взглянуть на страницу англоязычной Википедии, то там есть счетчик статей. Он меняется динамически и есть смысл проверять время от времени количество статей в свободной энциклопедии. Парсинг всегда требует предварительного анализа текста страницы, в частности изучения как раз того места, где этот счетчик находится. Это легко сделать например в браузере, запросив код страницы. Вот этот кусочек кода, котор
Программирование на языке Python. Простой пример парсинга web-страницы (urllib.request и html.parser)
29 декабря 202329 дек 2023
26
2 мин