Друзья, сегодняшнюю статью хотим посвятить важной теме, а именно «Как и с чего начать статистический анализ?🙌🏻
🔺Первый и очень важный этап анализа данных - это описательная статистика.
Представьте, что вам нужно объяснить человеку, что такое яблоко, при условии, что он никогда их не видел.
Вы расскажите, какой оно формы, цвета, размера, на что похоже. Так же и с данными.
Описательная статистика - это обобщение имеющихся данных с помощью определенных чисел, таких как среднее значение, медиана и т.д., чтобы облегчить понимание данных.
Описательная статистика - это представление имеющихся данных (выборки) без обобщения на всю генеральную совокупность.
Описательная статистика - это та база, без которой невозможно двигаться вперед в мире статистики. К счастью, это самый простой и приятный раздел для изучения.
🔺Какие используются методы описательной статистики?
⁃ Меры центральной тенденции
⁃ Меры разброса
Мера центральной тенденции - это сводка данных в виде одного числа, которая обычно описывает центр данных.
Эти числа бывают трех типов.
🔺Среднее значение - определяется как отношение суммы всех наблюдений в данных к общему числу наблюдений.
🔺Медиана - это точка, которая делит все данные на две равные половины. Одна половина данных меньше медианы, а другая - больше. Медиана рассчитывается путем расположения данных в порядке неубывания. Если количество наблюдений нечетное, медиана определяется по среднему наблюдению в отсортированном виде. Если количество наблюдений четное, медиана определяется средним значением между двумя средними наблюдениями в отсортированном виде.
🔺Мода - это число, которое имеет максимальную частоту во всем наборе данных, или, другими словами, мода - это число, которое встречается максимальное количество раз. Данные могут иметь одну или несколько мод.
Это была первая часть, в следующей статье мы раскроем меры разброса.