222 читали · 3 года назад
Веб-скрейпинг с нуля на Python: библиотека Beautiful Soup
Источник: Nuances of Programming Данные есть везде, на каждом посещенном вами сайте. Чаще всего они уже представлены в читаемом текстовом формате, пригодном для использования в новом проекте, однако, несмотря на то, что нужный текст всегда можно скопировать и вставить прямо со страницы сайта, когда речь заходит о больших данных  —  о тексте с десятка тысяч веб-сайтов  —  скрейпинг приходит на помощь. Обучаться веб-скрейпингу (web-scraping) поначалу сложно, однако если вы начнете своё знакомство с большими данными, используя правильные инструменты, то предстоящий вам путь существенно облегчится...
2064 читали · 1 год назад
Пишем телеграм бота-парсера на Python, с помощью библиотек requests, BeautifulSoup и aiogram
Используется библиотека requests для получения HTML-кода страницы. С помощью библиотеки BeautifulSoup извлекаются необходимые данные из HTML-кода. С помощью регулярных выражений и извлеченных данных формируется текстовый результат. Полученный результат выводится в телеграм боте. Парсер получает новости о спорте с сайта. Парсер извлекает информацию о виде спорта, времени, счете и командах, участвующих в матче. Результат выводится в телеграм боте. в виде текстовой информации. Первым делом...