Найти тему

Зачем аналитику знать статистику

Трудно, сказала бы невозможно, просыпаться после выходных и включаться в работу в понедельник. Сегодня не только понедельник, но и максимально душный день. Как всегда без объявления войны, прилетел любимый кейс.

Зачем аналитику данных знать основы математической статистики, теории вероятностей и прочие математические причуды? Действительно, а зачем? Мы живём в мире, на который влияет куча факторов одновременно, под рукой только уже свершившиеся события, и не факт, что события произойдут снова. Есть ли в этом логика? Конечно, что только не сделаешь, чтобы не изучать дисперсии и всё, что нам оставили Пирсон, Стьюдент и Фишер… не к ночи помянутые…

Большинство людей романтически воспринимают слово «аналитик», и в том числе словосочетание «аналитик данных», как некоего Шерлока Холмса, который из чертогов разума достаёт решения ситуаций, как кролика из рукава… Хоп-с и готово.

А интересно, как выглядел бы спор двух аналитиков данных, если бы на берегу не было договорённостей по инструментам прогнозов и ещё ничего не известно было бы про статистику, математическое ожидание, доверительный интервал и не могли бы договориться, как измерять точность прогноза?

— Я считаю, что лодка, скорее поплывёт, чем потонет?

— Почему?

— Потому что если кто-то сделал лодку, то очевидно, не для того, чтобы тонуть?

Как-то так… К сожалению, романтики в любой аналитике меньше всего, данные и цифры любят формулы и подсчёт. Поэтому проще говорить на одном языке и существовать в единой системе координат. И совершенно не случайно эту базу начали изучать в школе, потом продолжать в институте. Математики не любят играть в рулетку, но скорее всего именно они создавали казино, как прекрасный проект для бизнеса.

Любой прогноз обязан отталкиваться от уже свершившихся фактов, иначе не будет того фундамента, на котором попытаемся построить дом. Давайте представим, что мы сталкиваемся с каким-то событием первый раз, допустим, навстречу идёт невиданный зверь, какие варианты событий можем предположить? Только варианты, которые подсказывает наш опыт, не важно, приобретённый из книг или из жизни. Сколько таких вариантов будет? Много на самом деле, а по факту, зверь сделает что-то одно и не факт, что угадаем это действие. Если зверя встречаем в 5 раз, то предыдущий опыт значительно сузит вариации событий, хотя и будет намекать на возможные неожиданности. В мире цифр ещё проще, большинство вариантов уже организовано в критерии и закономерности, владея хотя бы базовыми понятиями, будет уже проще понять, что вероятность выпадения на кубике числа 5 это не 50 на 50 по принципу «или выпадет, или нет», а 1/6. Жить с таким пониманием становится гораздо проще, а работать в разы приятнее.

-2