9,4K подписчиков
Вступление Пошаговое руководство по началу работы с Seaborn! Если matplotlib «пытается сделать простые вещи легкими, а сложные - возможными», то seaborn также пытается упростить четко определенный набор сложных вещей...
3 года назад
84 подписчика
Визуализация данных — это большая часть работы специалистов в области data science. На ранних стадиях развития проекта часто необходимо выполнять разведочный анализ данных (РАД, Exploratory data analysis (EDA)), чтобы выявить закономерности, которые обнаруживают данные. Визуализация данных помогает представить большие и сложные наборы данных в простом и наглядном виде. На этапе окончания проекта важно суметь отчитаться о его результатах так, чтобы даже непрофессионалам, не обладающим техническими знаниями, всё стало ясно и понятно...
2 года назад
Диаграмма разброса, также известна как график рассеяния, является одной из самых простых и эффективных графических техник для изучения связи между двумя переменными. Эта диаграмма состоит из точек, которые представляют значения двух переменных в некоторых измерениях. График позволяет получить визуальное представление о том, как связаны две переменные, и позволяет определить наличие или отсутствие корреляционной зависимости между ними. Метод использования диаграммы разброса довольно прост. Необходимо...
1 год назад
13,8K подписчиков
Источник: Nuances of Programming В начале реализации проекта по исследованию данных важно обнаружить и обработать выбросы. В этом заключается одна из задач эксплораторного анализа данных. Мы рассмотрим три метода обнаружения выбросов. Но прежде выясним, что такое выброс, заглянув в Википедию: Выброс (в статистике)  —  это измерительная точка данных, которая значительно выделяется из общей выборки. Выбросы могут быть вызваны вариативностью измерений или указывать на экспериментальную ошибку; в последнем случае они иногда исключаются из набора данных...
2 года назад