И самым лучшим выбором для этого является lxml. Это библиотека позволяет быстро обрабатывать файлы XML и HTML формата.
Установка: pip install lxml
Он намного быстрее, чем html.parser и с ним в разы проще работать. Более стабильной и удобной альтернативой является html5lib, но это довольно медленная библиотека.
Если вашем коде используется только ElementTree API и код не полагается на какую-либо функциональность, специфичную для lxml.etree, вы также можете использовать следующие функции к исходному ElementTree:
Единственным недостатком модуля является его сильная зависимость от C. Подробнее обо всём на GitHub.
#python
#миниурок #lxml