Найти в Дзене
Машинное обучение

⚡️ Парсим XML и HTML

И самым лучшим выбором для этого является lxml. Это библиотека позволяет быстро обрабатывать файлы XML и HTML формата.

Установка: pip install lxml

Он намного быстрее, чем html.parser и с ним в разы проще работать. Более стабильной и удобной альтернативой является html5lib, но это довольно медленная библиотека.

Если вашем коде используется только ElementTree API и код не полагается на какую-либо функциональность, специфичную для lxml.etree, вы также можете использовать следующие функции к исходному ElementTree:

Единственным недостатком модуля является его сильная зависимость от C. Подробнее обо всём на GitHub.

#python

#миниурок #lxml

Python/ django
Машинное обучение RU