Найти в Дзене
Начало любого анализа данных
Мой Телеграм Для того чтобы подступиться к построению каких-либо моделей или проведению каких-либо стат-тестов, всегда нужно изучить имеющиеся на руках данные. Что за экселька прикрепленная к таске? Насколько идеальный ваш SQL-запрос? Как удачно вы распарсили JSON? В общем, много чего еще может случиться перед тем, как вы начнете непосредственно анализ. И на данные хорошо бы посмотреть глазками, до всех агрегаций и расчетов. Для этого прикольной заменой стандартного пандосовского describe может стать нехитрая библиотечка buckaroo...
2 месяца назад
Работа с виртуальной машиной часть 1
МОЙ ТЕЛЕГРАМ КАНАЛ Ранее я описывал процесс создания простой виртуальной машины в UI Яндекс.Облака. Сегодня покажу несколько простых вещей, которые можно сделать для начала. Понятно, что с виртуальной машиной можно сделать много чего, но сегодня покажу 3 кейса:. 1. подключимся к виртуальной машине через VS Code; 2. загрузим файл на виртуальную машину; 3. установим какой-никакой UI (можно понастальгировать по Norton Commander). Создание SSH-ключа самой ВМ и подключение через терминал VS Code было описано ранее...
2 месяца назад
Создание виртуальной машины в облаке
Мой Телеграмм Попробую сделать пару заметок-статей, в которых покажу, как можно работать с облачными виртуальными машинами. В первую очередь это будет полезно для тех, у кого при слове Linux случается паническая атака. Я не буду тратить время на объяснение, что такое Linux и виртуальные машины (далее — ВМ), а начнем сразу с того, что необходимо пользователю, чтобы начать с ними работать в облаке. Итак, первое, что понадобится, — это выбрать облако. Сейчас достаточно большое количество компаний предоставляет доступ к облакам...
3 месяца назад
Мода и Медиана на SQL
Мой Телеграм Давайте попробуем разобрать как на sql можно посчитать моду и медиану. это значение, которое чаще других значений встречается в выборке. Выборка может быть одна или несколько мод. вообще на практике я редко встречал что бы на это значение как-то опирались. Мне кажется это больше теоретическая характеристика распределения. Но на собеседовании могут спросить про это, а иногда и попросить посчитать на обычном SQL Предположим, есть некая таблица `users` и нам надо найти моду по столбцу...
117 читали · 9 месяцев назад
Важные метрики в электронной коммерции
Телеграмм канал Наверное, не секрет что метрики являются основном инструментом отслеживания состояния продукта. В разных компаниях бывает по-разному, где-то есть проработанное дерево метрик для каждой метрики определена чувствительность, а где-то считают прибыль и особо не смотрят на заумные аббревиатуры DAU, MAU, ARPPU Тем не менее, аналитик, даже начинающий, должен иметь представление о метриках продукта, жизнедеятельность которого он, собственно говоря, и обслуживает. Сейчас я вкратце дам описания...
9 месяцев назад
Python. Прикольные фишки pandas часть 1. map() , value_counts()
Мой телеграмм Это будет (надеюсь) серия коротких заметок про прикольные фишки pandas. Тут интересные пример использования map и value_counts Периодически возникает необходимость заменить значения в какой-то колонке на какие-то другие. Понятно, что можно использовать list comprehension, но использование map это один из способов — это сделать, и как мне кажется, не самый плохой Допустим есть какой-то датафрейм Предположим, надо изменить значение в колонке some_column_2 таким образом что 'y' стало 'yes', 'n' стало 'no' а nan заменилось на 'unknown'...
9 месяцев назад
Python. Пакет faker
Telegram faker - пакет для создания фейковых данных. Теоретически можно обойтись без него но есть и с ним может быть немного удобнее генерить разные датасеты. Прежде всего эта заметка будет нужна для того что бы ссылаться на на нее в будущем когда faker будет использован в каком то ноутбуке для генерации данных. В заметке приведены основные функции для более подробного изучение можно почитать документацию а так же, ссылка на google colab где это можно посмотреть ссылка на официальную документацию...
10 месяцев назад
Рекурсия в python
мой телеграмм канал Обычно, сходу, сложно уложить в голове понятие рекурсии. Тут мои мысли по этому поводу Определение из Википедии звучит так : Рекурсия — определение, описание, изображение какого-либо объекта или процесса внутри самого этого объекта или процесса, то есть ситуация, когда объект является частью самого себя. Термин «рекурсия» используется в различных специальных областях знаний — от лингвистики до логики, но наиболее широкое применение находит в математике и информатике В контекст...
10 месяцев назад