2899 читали · 6 лет назад
Парсинг страниц на Python. Parser на Python
Статья подготовлена для студентов курса «Разработчик Python» в образовательном проекте OTUS. Рано или поздно любой Python-программист сталкивается с задачей скопировать какой-нибудь материал с сайта. Так как страниц на нём достаточно много, терять время на ручное копирование — не самый лучший выход. К тому же, языки программирования затем и нужны, чтобы избавлять нас от рутинной работы, автоматизируя решение различных задач. Если же говорить о работе с HTML, то в Python есть отличные библиотеки для этого...
233 читали · 1 год назад
Как парсить статьи с сайта на python?
Пример простого кода на Python для парсинга текста статей с веб-сайта с использованием библиотеки BeautifulSoup. В данном примере мы делаем HTTP-запрос к указанному URL (одна статья с моего сайта), затем используем библиотеку BeautifulSoup для разбора HTML-кода и находим нужный элемент, содержащий текст статьи (в данном примере предполагается, что текст находится в элементе с классом 'entry-content'). Затем мы используем метод `get_text()` для получения чистого текста статьи. Чтобы найти класс, содержащий текст статьи, вам необходимо сохранить веб-страницу со статьей в формате html...