Рассмотрим, как визуализировать зависимость численной переменной (много значений) от категориальной. При выводе точек с соответствующими координатами по x и y картинка может быть не информативной, например, значений выживаемости по классам пассажиров Титаника: Простым решением является подсчет агрегированного значения по численной колонке: Однако библиотека Seaborn предлагает функцию catplot, упрощающую визуализацию категорий. Тот же график можно нарисовать с catplot, передав ей в качестве x и y те же значения, что и scatterplot, но дополнительно указав тип графика в параметре kind ('point', 'bar', 'violin'): kind='point' выдает похожую информацию чуть в другом виде и с началом не с 0 по оси y: Для вышеуказанных типов можно задавать параметр estimator, который по умолчанию показывает среднее (mean): kind='violin' строит распределения значений по каждой категории: По значениям категории можно строить отдельные графики (параметр col или row). Это добавляет еще одно измерение для визуализ
Отображаем зависимость численной колонки от категориальной с catplot
8 января 20238 янв 2023
58
~1 мин