2 года назад
Парсер новостных RSS-лент с возможностью поиска по определенным словам
#python #feedparser #parsing #анализ данных Ссылка на запись вебинара и ответы на вопросы по этой теме — будут размещены сегодня на нашем сайте Вчера мы уже рассматривали работу с RSS-каналом «Сейчас.ру» — ссылка. Сегодня поговорим о других крупные сайтах, таких как — Коммерсант, Лента.ру, Вести. В связи с ценностью данных для использования их в машинном обучении и других сферах, парсинг (от англ. parsing — разбор, анализ) является важным процессом для сбора информации. Помимо парсинга определенных сайтов, иногда возникает задача парсить сразу большое количество разных источников...
Парсинг данных с помощью скриптов Python (pandas_datareader).
В этой статье представлен сценарий на языке Python, который использует библиотеку pandas_datareader для разбора данных из различных источников. В частности, мы сосредоточимся на разборе акций с Нью-Йоркской фондовой биржи (NYSE) через Yahoo Finance. Если вам интересно узнать больше о pandas_datareader, посетите их официальный сайт. Библиотеки. Для начала нам необходимо установить две библиотеки - pandas_datareader и schedule, что мы можем сделать с помощью pip: import datetime as dt from pandas_datareader...