t.me/benchmarka.ru
Итак, завершаем описание списка методов. Квинтэссенция непонятности РАЗВЕДЫВАТЕЛЬНЫЙ АНАЛИЗ (EDA)
Используется, когда непонятно даже, какие вопросы задавать данным.
Кластеризация Суть: Поиск естественных групп в данных (метод k-средних и др.). Задача: Сегментация клиентов, когда мы не знаем, на какие группы они делятся.
Визуализация (графики, диаграммы рассеяния) Суть: Представление данных в графическом виде. Задача: Поиск паттернов, выбросов и зависимостей "на глаз", чтобы потом проверить их статистическими тестами. Ну, и простой алгоритм выбора (та самая шпаргалка по выбору метода):
1. У вас есть цифры и гипотеза? КОЛИЧЕСТВЕННЫЕ МЕТОДЫ (t-тест, регрессия). 2. Нужно понять, что будет через год, но данных нет? КАЧЕСТВЕННЫЕ МЕТОДЫ (Дельфи, SWOT) 3. Нужно принять решение "здесь и сейчас", а обстановка никак не способствует? МЕТОДЫ ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ (критерии Вальда, Сэвиджа). 4. Мир вокруг хаотичен и меняется каждую неделю (и это если еще аж целую(!) неделю