Любая сфера нашей жизни - это статистика. Тем более бизнес. Прогноз продаж, изменение цены, портреты потребителя, маркетинговые исследования, - все это статистика.
Вопрос в том, насколько правильно мы интерпретируем полученные данные. Сегодня о том, как избежать искажения полученных данных и не попасть на крючок манипуляций с помощью цифр.
Репрезентативность выборки
Предположим, вы хотите узнать удовлетворенность сотрудников работой. Но если компания слишком большая, отбирают ключевые характеристики и опрашивают определенное количество людей, которое соответствует заданным параметрам. Но ведь для кого-то мы можете оказаться первым работодателем. Сравнивать ему не с чем. Результаты опроса могут быть искажены.
Средняя температура по больнице
Среднее значение - сильное оружие в руках того, кто проводит анализ. Особенно, если в статистике силен он один.
Для примера рассмотрим зарплаты сотрудников. Предположим, на вас работают 5 человек, где каждый получает
- 10 000 р
- 15 000 р
- 50 000 р
- 65 000 р
- 70 000 р
Итого, в среднем каждый из них получает 42 000 р. (среднее арифметическое)
Но есть одно "но". И это медиана. тоже среднее, Но только в отношении центрального значения. И в этом случае это вообще 50 000.
Да, в среднем вы отличный работодатель!
Предельная точность
Еще одна уловка аналитиков. Вы замечали, что дробные цифры вызывают больше доверия, чем округленные значения?
Сравните, продукт А предпочли 20% аудитории и продукт В выбрали 15,47%.
15,47% означает, что ее реально высчитывали и ей надо бы верить. А вот 20%, скорее всего, округленное и преувеличенное значение.
Бессмысленная статистика
Представьте, что вы производитель газированных напитков и проводите анализ рынка. И вот вычитываете в газете, что спрос на газировку упал на 5,6%. "Ага", - думаете вы. - "Надо производить соки".
А почему? Только потому что газета написала о падении спроса? Нет, это неверно. Прежде чем принимать решения на основе подобных данных, определите причину и убедитесь, что спад этот стабилен, а не разовая акция.
Необоснованное обобщение
Такое происходит, когда данные, полученные для одной группы, переносят на другую, более широкую группу.
Например, опросили школьников одной школы, а вывод сделали обо всем районе или вообще городе. Собрали данные о зарплатах 2-3- крупных компаний и применили их на всю отрасль.
Очевидно, что это неправильный подход, но если аналитик не укажет, кого он опрашивал, а просто выдаст результаты исследований, вы окажетесь в заблуждении.
То же происходит и со статистикой в динамике. Если каждый год спрос на ваш товар растет, это не значит, что через несколько лет, покупать будут только его.
К чему мы все это? Если вам необходимо использовать вторичные данные для анализа прошедших событий или, наоборот, для будущих прогнозов, не хватайтесь жадно за цифры.
В добросовестных исследованиях указывается выборка, критерии ее формирования, первичные данные и методы расчета.
А кроме того, не забывайте о причинно-следственных связях! Цифры цифрами, но им надо уметь находить логичное объяснение!
Только тогда на полученные данные можно будет положиться.