Итак, допустим мы скачали все письма с почтового ящика, например так, как я описывал здесь. Теперь из всех этих файлов мы можем получить неочевидные инсайты. Например: кто нам пишет больше всего, с какого домена, как часто, в какой день недели…? А ещё такие письма можно попробовать использовать в качестве холодной базы, конечно же с разрешения абонентов ;) Но сначала, всю эту информацию нужно хитро вытащить из файлов eml. Сразу хочу отметить, что этот скрипт можно оптимизировать под аналитику сразу на лету, ещё на этапе выкачивания писем с почты. Но, после того как я через час попыток получал какую-либо ошибку и всё начинал с начала, я пришёл к мнению, что всё-таки лучше для все письма выкачать на локальную машину. А если писем не много или просто не хочется делать как я, то дело ваше. Открываем Jupyter Notebook, приступим… Чтобы замерить время на выполнения скрипта пишем это и добавляем библиотеки. Инициируем все нужные переменные. Основной блок обработки писем, в котором мы получаем