111 читали · 5 лет назад
Python парсинг xml в csv
Для работы с xml нам понадобится модуль xml.etree.ElementTree, а для работы с csv - модуль csv. Исходный код: #Импорт необходимых модулей import xml.etree.ElementTree as et import csv #Открываем файл data.csv на чтение. Если его нет, то он интерпретатор его создаст автоматически result_data = open('data.csv', 'w') #Записываем в tree данные из xml tree = et.parse('products.xml') #Считываем содержимое корневого элемента root = tree.getroot() #Создаем список заголовков для записи первой строки в файл data.csv result_head = [] #Добавляем заголовки в список result_head.append('category') result_head...
2 недели назад
Парсинг сайтов на python
Парсинг сайтов на Python — это процесс извлечения данных из веб-страниц. Python является одним из самых популярных языков для веб-скрейпинга благодаря своей простоте и мощным библиотекам. Основные шаги парсинга сайтов: Отправка HTTP-запроса: Получение HTML-кода веб-страницы. Парсинг HTML: Разбор полученного HTML-кода для извлечения нужных данных. Обработка данных: Сохранение, очистка или анализ извлеченной информации. Основные инструменты (библиотеки Python): Requests: Для отправки HTTP-запросов и получения содержимого веб-страниц. Beautiful Soup (bs4): Для парсинга HTML/XML документов, навигации по дереву документа и поиска нужных элементов...