ПарсерСкрипт для парсинга сайтов на Python | Автоматический сбор контента для GPT и AI
Парсинг писем eml на python
Итак, допустим мы скачали все письма с почтового ящика, например так, как я описывал здесь. Теперь из всех этих файлов мы можем получить неочевидные инсайты. Например: кто нам пишет больше всего, с какого домена, как часто, в какой день недели…? А ещё такие письма можно попробовать использовать в качестве холодной базы, конечно же с разрешения абонентов ;) Но сначала, всю эту информацию нужно хитро вытащить из файлов eml. Сразу хочу отметить, что этот скрипт можно оптимизировать под аналитику сразу на лету, ещё на этапе выкачивания писем с почты...
Парсинг страниц на Python. Parser на Python
Статья подготовлена для студентов курса «Разработчик Python» в образовательном проекте OTUS. Рано или поздно любой Python-программист сталкивается с задачей скопировать какой-нибудь материал с сайта. Так как страниц на нём достаточно много, терять время на ручное копирование — не самый лучший выход. К тому же, языки программирования затем и нужны, чтобы избавлять нас от рутинной работы, автоматизируя решение различных задач. Если же говорить о работе с HTML, то в Python есть отличные библиотеки для этого...