Найти в Дзене
Zettelkasten RU Community

### Причина изучить Python или как я влюбился в Data Science

У меня уже как год «свербит» желание освоить пайтон. Вначале это было неформализованное желание, просто на уровне «хотелки», потом я впервые попробовал навайбкодить себе парсер, который выгружает кое-какие данные с одного популярного книжного сервиса. У меня получилось, но дальше парсинга и эпизодических попыток что-то навайбкодить я не заходил. Не потому, что было неинтересно (как раз наоборот, очень интересно), а потому, что практической пользы для своей работы как учителя, исследователя и писателя я не видел. Однако в октябре у меня возникла необходимость провести статистический анализ пользы техник логирования в корпоративной среде. После выступления на конференции я собрал 60 анкет с кучей цифр и ответов на открытые вопросы. Я спрашивал друзей и “более опытных”, как это добро анализировать, и мне многие советовали воспользоваться плагинами для «экселечки», но, на мой взгляд, это было «не то». «Не то» по нескольким причинам. Первая и самая важная: Эксель — это чёрный ящик, я не з

### Причина изучить Python или как я влюбился в Data Science

У меня уже как год «свербит» желание освоить пайтон. Вначале это было неформализованное желание, просто на уровне «хотелки», потом я впервые попробовал навайбкодить себе парсер, который выгружает кое-какие данные с одного популярного книжного сервиса. У меня получилось, но дальше парсинга и эпизодических попыток что-то навайбкодить я не заходил. Не потому, что было неинтересно (как раз наоборот, очень интересно), а потому, что практической пользы для своей работы как учителя, исследователя и писателя я не видел.

Однако в октябре у меня возникла необходимость провести статистический анализ пользы техник логирования в корпоративной среде. После выступления на конференции я собрал 60 анкет с кучей цифр и ответов на открытые вопросы. Я спрашивал друзей и “более опытных”, как это добро анализировать, и мне многие советовали воспользоваться плагинами для «экселечки», но, на мой взгляд, это было «не то».

«Не то» по нескольким причинам. Первая и самая важная: Эксель — это чёрный ящик, я не знаю, какая математика происходит «под капотом» расчётов всяких стат. критериев. От этой опции я сразу отказался и начал искать. И наше уютное сообщество подсказало.

Кто-то из моих подписчиков написал слово Anaconda и R, ну а дальше я сам начал разбираться, что это такое и с чем это едят. Оказывается, пайтон — это та ещё вундервафля в стат. анализе. Настолько универсальная, что можно творить что угодно. Но мне всё ещё не хватало интерфейсов: через что взаимодействовать с кодом? VS Code и всякие Пайчармы, конечно, неплохи, но они ли в ходу при анализе данных? Оказывается, что и да, и нет. Существуют ещё блокноты.

Первым мне попался Jupyter Notebook, в котором я «провернул» первую пару своих анализов (про логирование и экранное время детей), но потом мне открыли глаза, написав в чатике слово Marimo.

Недолгий поиск вывел меня в «новые воды» реактивных блокнотов. Динамичных, которые изменяются в зависимости от моих действий. Я настолько преисполнился, что начал делать очень многие штуки в нём.

В качестве примера «многих штук» — небольшая «бытовуха». Конец полугодия, мне нужно «раздавать» семестровые оценки в школе. У меня 7 классов, в каждом из классов в среднем по 18 детей, нужно посчитать накопляемость оценок. У каждого ребёнка с сентября по декабрь должно быть минимум по 7 оценок. Как бы я делал это раньше? Считал ручками, буквально: открывал каждый журнал и считал глазами оценки. Но в этом году у меня есть пайтон и навыки вайбкодинга, а вместе с реактивным блокнотом у меня убийственное комбо.

Я выгрузил все журналы в csv-шечки, и вместе с Gemini 3 написал код, запустил реактивный блокнот и — вуаля: у меня графики по каждому из классов с накопляемостью оценок (см. картинки).

Осталось выявить «отстающих» и попросить детей выполнить пару заданий, чтобы поставить им оценки.

А сегодня у меня ещё более крутой пример: вчера закончил верстать рукопись третьей книги, но…

В ней есть некоторое количество ссылок на другие эссе, опубликованные в моём цифровом садике. Мне это не нравится, мне не хочется «отправлять» читателя куда-то ещё, кроме своей книги, поэтому я задумался над тем, чтобы создать раздел с приложениями в своей книге, в котором я опубликую все эссе, на которые ссылаюсь. Но это проблема: у меня 138 сносок, в которых только часть — это ссылки, остальное — мои комментарии и указания источников. Листать страницу за страницей требует от меня усилий, которых на эту рутину просто нет.

Выход: снова пайтон и реактивный блокнот Маримо.

Я быстро навайбкодил себе «приложение», которое извлекает все сноски из моего вордовского файла. Мне потребовалось чуть более 10 минут, чтобы сделать это. Но самое главное, Маримо выводит всё в виде списка, который можно фильтровать, и искать среди сносок нужную мне информацию. Например, все сноски, где есть http, или все, в которых встречается слово «эссе».

Ответственно заявляю: я влюбился в пайтон и датасайнс.

Вот тоже самое но на форуме

-2