Для этого нам понадобится библиотека requests для получения HTML-кода веб-страницы, и библиотека BeautifulSoup для парсинга HTML-кода и извлечения заголовков новостей.
Вы можете установить эти библиотеки с помощью pip:
--------------------------------------------------------------------------------------------
pip install requests
pip install beautifulsoup4
--------------------------------------------------------------------------------------------
Далее ниже приведен пример программы на Python, которая извлекает заголовки новостей с веб-сайта:
--------------------------------------------------------------------------------------------
import requests
from bs4 import BeautifulSoup
url = 'https://lenta.ru/' # Замените lenta.ru на адрес нужного сайта
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# Извлекаем заголовки новостей
news_headlines = soup.find_all('a') # Замените 'a' на тег, где находятся заголовки новостей на сайте
for headline in news_headlines:
print(headline.text)
--------------------------------------------------------------------------------------------
Обратите внимание, что в этом примере мы использовали 'a' как пример тега, в котором могут содержаться заголовки новостей. В зависимости от веб-сайта, вам может потребоваться использовать другие теги или классы для извлечения заголовков.
Также учтите, что извлечение информации из веб-сайтов должно соответствовать их политике в отношении авторского права и использования информации.