Здравствуйте, уважаемые читатели! В этой статье мы рассмотрим описательные статистки, бокс плот и гистограмму частот на примере показателя В среднем руб. на текущем счете на человека, взятого из датасета ПАО Сбербанк. Научимся вычислять и строить их, используя KNIME. Это уже третья статья посвящённая данной аналитической платформе. Предыдущие Вы можете прочитать здесь Знакомство и здесь Визуализация. Подготовительные работы Последовательность действий представлена на Рис. 1 Начнём с того, что выберем из нашего датасета только необходимые сведения...
Картинка выше это boxplot (ящик с усами). Boxplot - это удобный способ изобразить распределение данных, используя всего 5 метрик: 1. «Минимум» = Q1 - 1.5 * IQR 2. Первый квартиль (Q1) 3. Медиана 4. Третий квартиль (Q3) 5. «Максимум» = Q3 + 1.5 * IQR По графику сразу можно понять выбросы (outliers), симметричен ли дата-сет, как плотно лежат значения и как скошено распределение. Обратите внимание, что для ящика с усами «минимум» и «максимум» не являются минимальным и максимальным значением, а лишь помогают определить выбросы...