2 подписчика

🚀 НОВЕЙШИЙ БЫСТРЕЙШИЙ HTML-ПАРСЕР НА Python

21 июня 202521 июн 2025

1 мин

🚀 НОВЕЙШИЙ БЫСТРЕЙШИЙ HTML-ПАРСЕР НА Python! Создана новая библиотека-парсер HTML, реализованная на основе C-библиотеки reliq, с Python-обертками. Модель ориентирована на обработку и парсинг HTML с высокой скоростью и оптимальной памятью, что подтверждается тестами и сравнением с аналогами. 🔹 Особенности проекта: ✅ Встроенный парсер HTML с функциями обхода и поиска элементов. ✅ В отличие от популярных решений, не использует стандартизированные селекторы, такие как CSS или XPath, а реализует собственный язык поиска (подробнее — в основной библиотеке, полная документация в man-секции). 🔸 Поддержка платформ: ✅ Windows, Linux (x86, аarch64, armv7), macOS. ✅ Доступны скомпилированные пакеты (PyPI), что значительно упрощает установку и интеграцию. 📍 Ключевые особенности: ✅ Высокая скорость благодаря созданию парсенной структуры, основанной на исходной HTML-строке. ✅ Для изменения HTML потребуется пересоздание структуры, что повышает безопасность и предсказуемость. ✅ Отсутствие

🚀 НОВЕЙШИЙ БЫСТРЕЙШИЙ HTML-ПАРСЕР НА Python!

Создана новая библиотека-парсер HTML, реализованная на основе C-библиотеки reliq, с Python-обертками. Модель ориентирована на обработку и парсинг HTML с высокой скоростью и оптимальной памятью, что подтверждается тестами и сравнением с аналогами.

🔹 Особенности проекта:

✅ Встроенный парсер HTML с функциями обхода и поиска элементов.

✅ В отличие от популярных решений, не использует стандартизированные селекторы, такие как CSS или XPath, а реализует собственный язык поиска (подробнее — в основной библиотеке, полная документация в man-секции).

🔸 Поддержка платформ:

✅ Windows, Linux (x86, аarch64, armv7), macOS.

✅ Доступны скомпилированные пакеты (PyPI), что значительно упрощает установку и интеграцию.

📍 Ключевые особенности:

✅ Высокая скорость благодаря созданию парсенной структуры, основанной на исходной HTML-строке.

✅ Для изменения HTML потребуется пересоздание структуры, что повышает безопасность и предсказуемость.

✅ Отсутствие функций для динамических изменений структуры, что делает парсер идеальным для задач, связанных с чтением и извлечением данных.

Код для быстрого начала доступен по ссылке: пример.

Данный парсер активно применяется в профессиональных проектах — например, для скрейпинга форумов, торрент-трекеров и медиаконтента, что подтверждает его эффективность и универсальность.

Для сравнения производительности и памяти проведены тесты с другими библиотеками, результат — значительно лучшая скорость и меньшее потребление ресурсов за счет принципа хранения данных.

💡 Инновационная архитектура и высокая производительность делают его одним из самых перспективных решений для парсинга HTML в Python!