Вы можете использовать библиотеку BeautifulSoup для парсинга следующих элементов страницы: - Текст - Изображения - Таблицы - Формы - Ссылки - Заголовки - Списки - Комментарии - Метаданные Для парсинга текста вы можете использовать следующий код: ```python from bs4 import BeautifulSoup import requests url = 'https://example.com' page = requests.get(url) soup = BeautifulSoup(page.content, 'html.parser') # Получить все тексты на странице texts = soup.find_all('p') for text in texts: print(text.text) ``` Для парсинга изображений вы можете использовать следующий код: ```python from bs4 import BeautifulSoup import requests url = 'https://example...
Созрела задача: получить сведения о компаниях, зарегистрированных в Вологодской области на последние 3 года. Компании должны быть исключительно коммерческими. Доступ к открытым данным ИФНС России предоставляет на своём сайте: https://egrul.nalog.ru/index.html. Форма получения - ручная, со вводом каждого запрашиваемого ИНН или ОГРН. Такой формат нам не подходит, в виду того, что займет очень много времени. Доступ к официальному API налоговой - платный. Бюджет нашей задачи - "ноль рублей". Снова не подходит :) Активный поиск информации в сети - привел на страницу https://dzen...