453 читали · 6 лет назад
HTML парсер на Python
Учитывая современное развитие Интернета, было бы кощунством не написать приложение, взаимодействующее со всемирной паутиной. Сегодня мы напишем простенький html-парсер на Python. Наше приложение будет читать код указанной страницы сайта и сохранять все ссылки в ней в отдельный файл. Это приложение может помочь SEO-аналитикам и веб-разработчикам. Писать будем на Python 3, в котором есть встроенный класс для html-парсера из модуля html.parser from html.parser import HTMLParser Так же нам понадобится функция urlopen из модуля urllib from urllib...
9 месяцев назад
🚀 НОВЕЙШИЙ БЫСТРЕЙШИЙ HTML-ПАРСЕР НА Python
🚀 НОВЕЙШИЙ БЫСТРЕЙШИЙ HTML-ПАРСЕР НА Python! Создана новая библиотека-парсер HTML, реализованная на основе C-библиотеки reliq, с Python-обертками. Модель ориентирована на обработку и парсинг HTML с высокой скоростью и оптимальной памятью, что подтверждается тестами и сравнением с аналогами. 🔹 Особенности проекта: ✅ Встроенный парсер HTML с функциями обхода и поиска элементов. ✅ В отличие от популярных решений, не использует стандартизированные селекторы, такие как CSS или XPath, а реализует собственный язык поиска (подробнее — в основной библиотеке, полная документация в man-секции). 🔸 Поддержка платформ: ✅ Windows, Linux (x86, аarch64, armv7), macOS...