119 читали · 4 года назад
Удаление лишней информации из узлов больших XML-файлов "на коленке".
Имеем большой XML-прайс, который невозможно обработать специальным модулем на сайте из-за ограничений хостинга ( в моем случае 320 мегабайт). Выглядит он приблизительно так: <xml_catalog date="2029-04-16 11:32"> <shop> <name>Бананлаб</name> <company>Компания Бананлаб</company> <currencies> <currency id="RUR" rate="1"/> <currency id="USD" rate="76.98"/> </currencies> <categories> <category id="1" uid="1100932" OrderBy="3001251"> KVM-переключатели </category> <category id="2" uid="1100933" OrderBy="11001763">Кабеля</category> <category id="3" uid="199936" parentId="5202" OrderBy="1151">Батарейки...
504 читали · 2 года назад
Программирование на языке Python. Работа с xml форматом с помощью модуля xml.etree.ElementTree
Доброго времени суток, читатели, зрители моего канала programmer's notes. Не забывайте подписываться и писать свои комментарии к моим статьям и видео. Модуль xml.etree.ElementTree для работы с xml-форматом Я надеюсь, что читатель знаком с xml-форматом, хотя бы на некоторых простых примерах и поэтому я лишаю себя обязанности этот формат излагать. А вот непосредственно возможности стандартного модуля поддержки xml-формата я представлю здесь в статье. Формирование xml-документа на python Модуль xml...
193 читали · 6 лет назад
Python парсинг xml в csv
Для работы с xml нам понадобится модуль xml.etree.ElementTree, а для работы с csv - модуль csv. Исходный код: #Импорт необходимых модулей import xml.etree.ElementTree as et import csv #Открываем файл data.csv на чтение. Если его нет, то он интерпретатор его создаст автоматически result_data = open('data.csv', 'w') #Записываем в tree данные из xml tree = et.parse('products.xml') #Считываем содержимое корневого элемента root = tree.getroot() #Создаем список заголовков для записи первой строки в файл data.csv result_head = [] #Добавляем заголовки в список result_head.append('category') result_head...
275 читали · 2 года назад
Программирование на языке Python. Парсинг html-страниц с помощью стандартного модуля html.parser
Доброго времени суток, читатели, зрители моего канала programmer's notes. Не забывайте подписываться и писать свои комментарии к моим статьям и видео. Парсинг страниц html с помощью модуля html.parser Для парсинга web-страниц есть разные библиотеки. И мы будем к ним обращаться. Но есть и совершенно замечательный стандартный модуль html.parser. Вот сегодня мы им и займёмся. Чтобы разбирать html-страницу, необходимо создать объект класса HTMLParser. У него есть целый набор методов, часть из которых запускается автоматически при отправке объекту текста html-страницы...