06:44
1,0×
00:00/06:44
358,8 тыс смотрели · 3 года назад
3 недели назад
Beautifulsoup python парсинг
Beautiful Soup (обычно импортируемый как bs4) — это мощная библиотека Python для парсинга HTML и XML документов. Она создает "суп" из синтаксически неоднородных (даже с ошибками) веб-страниц, предоставляя удобные методы для навигации, поиска и модификации дерева разбора. Beautiful Soup Не занимается запросами к веб-серверам (это делают такие библиотеки, как requests). Ее задача — взять уже полученный HTML-код и сделать его пригодным для удобного извлечения данных. Установка Перед началом работы убедитесь, что Beautiful Soup установлен: Bash Pip install beautifulsoup4 Также рекомендуется установить...
237 читали · 3 года назад
Веб-скрейпинг с нуля на Python: библиотека Beautiful Soup
Источник: Nuances of Programming Данные есть везде, на каждом посещенном вами сайте. Чаще всего они уже представлены в читаемом текстовом формате, пригодном для использования в новом проекте, однако, несмотря на то, что нужный текст всегда можно скопировать и вставить прямо со страницы сайта, когда речь заходит о больших данных  —  о тексте с десятка тысяч веб-сайтов  —  скрейпинг приходит на помощь. Обучаться веб-скрейпингу (web-scraping) поначалу сложно, однако если вы начнете своё знакомство с большими данными, используя правильные инструменты, то предстоящий вам путь существенно облегчится...