103 читали · 2 года назад
Парсер новостных RSS-лент с возможностью поиска по определенным словам
#python #feedparser #parsing #анализ данных Ссылка на запись вебинара и ответы на вопросы по этой теме — будут размещены сегодня на нашем сайте Вчера мы уже рассматривали работу с RSS-каналом «Сейчас.ру» — ссылка. Сегодня поговорим о других крупные сайтах, таких как — Коммерсант, Лента.ру, Вести. В связи с ценностью данных для использования их в машинном обучении и других сферах, парсинг (от англ. parsing — разбор, анализ) является важным процессом для сбора информации. Помимо парсинга определенных сайтов, иногда возникает задача парсить сразу большое количество разных источников...
2895 читали · 5 лет назад
Парсинг страниц на Python. Parser на Python
Статья подготовлена для студентов курса «Разработчик Python» в образовательном проекте OTUS. Рано или поздно любой Python-программист сталкивается с задачей скопировать какой-нибудь материал с сайта. Так как страниц на нём достаточно много, терять время на ручное копирование — не самый лучший выход. К тому же, языки программирования затем и нужны, чтобы избавлять нас от рутинной работы, автоматизируя решение различных задач. Если же говорить о работе с HTML, то в Python есть отличные библиотеки для этого...