257 подписчиков

Зачем так много методологий анализа данных? Почему новичку бывает трудно входить в мир данных?

31 марта 202531 мар 2025

26 мин

Список в конце статьи из ста различных подходов к анализу и работе с данными (и это далеко не предел!) отлично показывает, насколько это направление обширно и многообразно. Каждая методика — это реакция на конкретные задачи, отрасли и вызовы. Но среди этого изобилия легко потеряться. Особенно тем, кто только начинает. Давайте разберёмся, откуда всё это берётся — и почему важно сначала понять главное, прежде чем погружаться в детали. Анализ данных используется повсюду: от торговли до здравоохранения, от финансов до науки. И в каждой сфере свои особенности. Пример: одна и та же задача — например, прогноз продаж — в ритейле и фармацевтике требует разных подходов. В первом случае главное — скорость реакции на сезонность, во втором — строгая документация, этичность и регуляции. С появлением новых инструментов, платформ и облачных вычислений появились и новые фреймворки: Если раньше анализ данных был больше "игрой в Excel", то теперь — стратегический актив компании. Потому и появляются новые

Оглавление

Почему методологий так много?
Разные области — разные требования
Технологии развиваются — подходы тоже

Почему методологий так много?

Разные области — разные требования

Анализ данных используется повсюду: от торговли до здравоохранения, от финансов до науки. И в каждой сфере свои особенности.

В медицине, например, на первый план выходят безопасность, конфиденциальность и прозрачность (важно понимать, как модель делает прогноз, особенно если речь о здоровье).
В маркетинге — скорость. Нужно быстро запустить тест (например, A/B), получить результат и принять решение.
В производстве — надёжность. Там применяют методики, которые позволяют выявлять корневые причины сбоев (например, "5 Почему?" или FMEA).
В научной сфере важно, чтобы любой результат можно было воспроизвести. Поэтому там ценятся стандарты вроде FAIR — чтобы эксперименты не терялись, а данные были понятны и другим исследователям.

Пример: одна и та же задача — например, прогноз продаж — в ритейле и фармацевтике требует разных подходов. В первом случае главное — скорость реакции на сезонность, во втором — строгая документация, этичность и регуляции.

Технологии развиваются — подходы тоже

С появлением новых инструментов, платформ и облачных вычислений появились и новые фреймворки:

Облачные решения (например, Microsoft Azure, AWS) привели к созданию MLOps — подхода, который помогает автоматизировать всю работу с моделями — от обучения до мониторинга.
Big Data привела нас к архитектурам типа "Лямбда" — когда данные обрабатываются как в пакетном (batch), так и в реальном времени.
За последние годы сильно продвинулись разработки в области искусственного интеллекта — и вместе с ними возникли новые подходы: как объяснять "черные ящики" (Explainable AI), как работать с чувствительными данными (Federated Learning).

Организации стали взрослее. Сложнее. Структурированнее.

Если раньше анализ данных был больше "игрой в Excel", то теперь — стратегический актив компании. Потому и появляются новые практики управления: мониторинг качества данных, управление правами доступа, формирование единого "источника правды", обучение сотрудников аналитической культуре — всё это требует своих методик.

Например:

Небольшим стартапам подойдут гибкие и лёгкие форматы: быстрые гипотезы, MVP, спринты.
А вот банку или госструктуре нужен серьёзный подход к управлению метаданными, прозрачности источников, соблюдению законодательства (например, GDPR).

Разные команды — разные стили работы

Одни компании живут в духе "гибких методологий": работают по Agile, часто питают идеи от дизайн-мышления. Другие строят прогнозы в Excel, следуют строгим регламентам и любят иерархию. И для каждой команды важна "своя" методика.

Пример: стартап может использовать цикл HADI (Гипотеза → Действие → Данные → Инсайты), чтобы за 2 недели протестировать новый экран регистрации. А телеком-компания будет использовать OGSM: цели, стратегии, метрики — чтобы согласовать направление всей организации.

Некоторые методики решают узкие, но важные задачи

Не всегда нужно "всё сразу" — иногда достаточно методики, которая отвечает за один аспект:

Как оценить, насколько хороши мои данные? (Data Quality Framework)
Как зафиксировать, откуда пришли данные и как они изменялись по пути? (Data Lineage)
Как оценить, какой эффект мои данные оказывают на бизнес? (Data Impact Assessment)

Работа с данными — это не только цифры, но и люди

Методологии всё чаще пересекаются с тем, как принимаются решения, как работает команда, какие навыки есть у сотрудников.

Пример:

Data Literacy (грамотность в работе с данными) учит не только кодить, но и правильно задавать вопросы: "что означают эти показатели", "как визуализировать данные для директора", "как избежать искажений в интерпретации".

Итерации как стиль мышления

Самое важное: современный мир данных — это всегда цикл. Пробуем → анализируем → улучшаем → снова пробуем. И методологии под это адаптируются:

Классика PDCA (Планируй - Делай - Проверяй - Действуй).
CRISP-DM: от задачи до внедрения — и обратно.
Agile: короткие циклы разработки, обратная связь, и снова вперёд.

Иногда создаются даже гибриды: CRISP-DM + Agile, или MLOps + DevOps. Всё ради того, чтобы объединить стабильность и гибкость.

Так в чём же проблема для новичка?

Для опытных специалистов — эти 100+ методик как набор ключей: каждый подходит к своей двери. Но для новичка это может быть лабиринт.

На старте кажется, что без сложных фреймворков нельзя ничего делать.
В голове путаница: то ли учить Python, то ли визуализации, то ли изучать TDSP.
Возникает страх ошибиться: «а вдруг я выберу не ту методологию?».

Но истина — в другом. Главное, что нужно понять сначала:

Данные — это способ понять любую систему

Независимо от инструментов, все методики служат одной цели — помочь человеку увидеть закономерности. Цифры — это отражение реальности. Анализ данных — это диалог с процессом.

Простые вопросы важнее названий фреймворков:

Что я хочу узнать?
Какие у меня есть данные?
Что они мне говорят?
Какие выводы я могу делать — и чего пока не знаю?

Понимание этого — отправная точка настоящего анализа.

Универсальные принципы, с которых стоит начинать

До всех классификаций, аббревиатур и сложных инструментов — есть простые правила:

Контекст. Данные без понимания предметной области могут ввести в заблуждение.
Цель. Любой анализ должен иметь вопрос, на который вы ищете ответ.
Чистота. Если данные искажены, никакая модель не спасёт.
Интерпретация. Ценность не в формуле, а в объяснении для живого человека.
Итерации. Ошибки — это часть процесса: на них учатся, пробуют заново, уточняют гипотезы.

Их используют все: от начинающих аналитиков до исследователей Google.

Пример: пусть у вас — онлайн-магазин

Вы видите, что продажи упали. Что будет логичнее: изучать линейную регрессию или сделать "разведку":

Какой сегмент покупателей ушёл?
Что изменилось на сайте?
Было ли обновление мобильной версии?
Повлияло ли повышение цен?

На этом этапе важно не знание методологии, а грамотные вопросы.

Методики — это надстройка. Сначала — мышление

Ошибки новичков:

Заучивание шагов без понимания смысла.
Слепое следование фреймворку: "так написано — значит, так надо".
Приоритет "как делать", а не "зачем делать".

В реальности: научитесь анализировать — и потом любая методика станет вам под рукой.

Как по-настоящему войти в мир данных?

Учитесь смотреть на данные как на зеркало процессов.
Развивайте мышление: задавайте вопросы, ищите паттерны.
Используйте простые инструменты — графики, таблицы, сравнение метрик.
Учитесь интерпретировать: уметь объяснить — важнее, чем спрогнозировать.
Потом — добавляйте методики, инструменты, модели.

Методологии не дают анализа "по шаблону" — они помогают систематизировать ваши мысли. Но только если вы сначала научились думать.

Поэтому: важны не названия фреймворков, а умение добывать смысл из данных. Не бойтесь начать с простого. Учитесь видеть цифры как динамику, задавайте вопросы, спорьте с графиками, ищите причинно-следственные связи. А все эти CRISP-DM, DMAIC и MLOps — потом встанут на свои места. И не будут мешать, наоборот — будут помогать.

Именно так строится настоящий путь в мир анализа данных. Это как в музыке: сначала вы учитесь слышать ноты, ритм, чувствовать мелодию. Потом — осваиваете аккорды и ноты, а уже позже — композиторские техники и жанры. Анализ данных требует той же последовательности: сначала — слух (мышление), потом — инструменты.

1. CRISP-DM (Cross-Industry Standard Process for Data Mining)

Этапы:

Бизнес-понимание (определение целей).
Понимание данных (сбор и анализ данных).
Подготовка данных (очистка, трансформация).
Моделирование (выбор алгоритмов).
Оценка (проверка эффективности).
Внедрение (интеграция в бизнес-процессы).

Применение: Классические проекты Data Mining, прогнозная аналитика.

2. OSEMN (Obtain, Scrub, Explore, Model, Interpret)

Этапы:

Получение данных (Obtain).
Очистка данных (Scrub).
Исследование данных (Explore).
Построение модели (Model).
Интерпретация результатов (Interpret).

Применение: Технически ориентированные проекты, стартапы.

3. TDSP (Team Data Science Process)

Этапы:

Бизнес-понимание.
Приобретение и обработка данных.
Моделирование.
Развертывание.
Принятие решений (мониторинг и оптимизация).

Применение: Командные проекты с использованием облачных технологий (Azure, AWS).

4. KDD (Knowledge Discovery in Databases)

Этапы:

Выбор данных.
Предобработка (очистка, интеграция).
Преобразование данных.
Data Mining (анализ).
Интерпретация результатов.

Применение: Академические исследования, сложные аналитические задачи.

5. SEMMA (Sample, Explore, Modify, Model, Assess)

Этапы:

Выборка данных (Sample).
Исследование (Explore).
Модификация данных (Modify).
Моделирование (Model).
Оценка (Assess).

Применение: Проекты с использованием инструментов SAS, технический фокус.

6. Agile Data Science

Принципы:
Итеративность (спринты).
Постоянное взаимодействие с заказчиком.
Быстрые прототипы (MVP).
Применение: Динамичные проекты, стартапы, MVP-разработка.

7. DMAIC (Six Sigma)

Этапы:

Определение проблемы (Define).
Измерение данных (Measure).
Анализ причин (Analyze).
Улучшение (Improve).
Контроль результатов (Control).

Применение: Оптимизация бизнес-процессов, управление качеством.

8. Google’s OODA Loop (Observe, Orient, Decide, Act)

Этапы:

Наблюдение (сбор данных).
Ориентирование (анализ контекста).
Решение (выбор стратегии).
Действие (реализация).

Применение: Быстрое реагирование на изменения, управление в условиях неопределенности.

9. Design Thinking + Data Science

Этапы:

Empathize (понимание потребностей пользователей через данные).
Define (формулировка проблемы на основе данных).
Ideate (генерация гипотез и идей).
Prototype (создание MVP с использованием данных).
Test (валидация через A/B-тесты или анализ метрик).

Применение: Проекты, где важны креативность и пользовательский опыт (например, стартапы, цифровые продукты).

10. MLOps (Machine Learning Operations)

Этапы:

Data Collection & Preparation (автоматизация сбора данных).
Model Development & Training (CI/CD для моделей).
Deployment (интеграция в production-среду).
Monitoring (отслеживание дрейфа данных и производительности модели).
Retraining (автоматическое обновление моделей).

Применение: Промышленное внедрение ML-моделей, масштабируемые AI-решения.

11. IBM’s Data Science Method

Этапы:

Business Understanding (аналогично CRISP-DM).
Analytic Approach (выбор методов: предиктивная аналитика, NLP и т.д.).
Data Requirements (определение необходимых данных).
Data Collection & Preparation.
Modeling & Evaluation.
Deployment & Feedback.

Применение: Корпоративные проекты, интеграция с IBM-инструментами (Watson).

12. Data-Centric AI

Принципы:
Акцент на качество данных, а не только на алгоритмы.
Этапы:

Data Auditing (оценка качества данных).
Data Labeling & Augmentation.
Error Analysis (поиск паттернов в ошибках модели).
Iterative Improvement (циклы исправления данных).

Применение: Проекты с "грязными" данными, компьютерное зрение, NLP.

13. A/B Testing Framework

Этапы:

Hypothesis Formulation (например, "Новая рекомендательная система увеличит конверсию").
Design Experiment (определение контрольной и тестовой групп).
Data Collection.
Statistical Analysis (проверка значимости результатов).
Decision & Scaling (внедрение успешного варианта).

Применение: Маркетинг, UX/UI-оптимизация, цифровые продукты.

14. Data Storytelling

Этапы:

Identify Key Insights (выводы из анализа данных).
Craft Narrative (построение логической цепочки).
Visualization (графики, дашборды).
Delivery (презентация для стейкхолдеров).

Применение: Доклады для руководства, отчеты для не-технической аудитории.

15. FAIR Data Principles

Принципы:
Findable (данные легко искать).
Accessible (доступ через стандартные протоколы).
Interoperable (совместимость с другими системами).
Reusable (метаданные для повторного использования).
Применение: Научные исследования, государственные данные, долгосрочные проекты.

16. Predictive Analytics Process (PAP)

Этапы:

Problem Definition (что предсказываем?).
Data Exploration (анализ исторических данных).
Feature Engineering (создание признаков для модели).
Model Selection & Tuning (оптимизация гиперпараметров).
Validation & Deployment.

Применение: Прогнозирование спроса, риск-менеджмент.

17. Responsible AI Framework

Принципы:
Fairness (отсутствие дискриминации в данных).
Transparency (интерпретируемость моделей).
Privacy (защита персональных данных, GDPR).
Accountability (отслеживание последствий решений).
Применение: Финансы, здравоохранение, государственные проекты.

18. Big Data Analytics Frameworks

Примеры:
Lambda Architecture (batch + real-time обработка).
Kappa Architecture (только real-time через стриминг, например, Apache Kafka).
Применение: Обработка потоковых данных (IoT, соцсети), высоконагруженные системы.

19. Data Mesh

Принципы:
Decentralization (данные — продукт, за который отвечают команды).
Self-Service (инфраструктура для самостоятельного доступа).
Federated Governance (единые стандарты без централизации).
Применение: Крупные компании с распределенными данными (например, банки, ритейл).

20. Hybrid Approach (CRISP-DM + Agile)

Этапы:
Использование циклов CRISP-DM внутри Agile-спринтов.
Регулярные демонстрации результатов заказчику.
Применение: Проекты с неопределенными требованиями, где нужна и гибкость, и структура.

21. Analytics Canvas (по аналогии с Business Model Canvas)

Принципы:
Визуальное проектирование аналитических проектов на одном холсте.
Ключевые блоки: бизнес-цели, данные, метрики, стейкхолдеры, риски.
Применение: Стратегическое планирование проектов, стартапы, питчи для инвесторов.

22. Event-Driven Data Science

Этапы:

Event Identification (определение значимых событий в данных, например, клики, транзакции).
Real-Time Processing (обработка через Apache Kafka, AWS Kinesis).
Trigger-Based Actions (автоматические реакции: уведомления, обновления моделей).

Применение: Финтех, рекомендательные системы, IoT.

23. Domain-Driven Data Science

Принципы:
Глубокое погружение в предметную область (например, медицина, логистика).
Совместная работа с экспертами-доменщиками для интерпретации данных.
Применение: Сложные отрасли, где критично понимание контекста (фармацевтика, энергетика).

24. Data Quality Management (DQM) Framework

Этапы:

Data Profiling (анализ структуры и аномалий).
Cleaning & Standardization.
Monitoring & Maintenance (постоянный контроль качества).
Metadata Management (документирование источников и преобразований).

Применение: Проекты с низким качеством данных, интеграция данных из разных систем.

25. Causal Inference Framework

Методы:
A/B-тесты, Difference-in-Differences, Instrumental Variables.
Этапы: формулировка причинного вопроса, выбор метода, проверка предположений.
Применение: Экономика, эпидемиология, оценка воздействия рекламы.

26. DataOps

Принципы:
Автоматизация пайплайнов данных (CI/CD для ETL).
Коллаборация между инженерами данных, аналитиками и бизнесом.
Метрики: скорость доставки данных, частота ошибок.
Применение: Ускорение аналитических процессов, корпоративная аналитика.

27. System Dynamics (моделирование сложных систем)

Этапы:

Построение причинно-следственных диаграмм.
Создание математических моделей с обратными связями.
Симуляция сценариев ("что если").

Применение: Управление цепочками поставок, экологическое моделирование.

28. Prescriptive Analytics Framework

Цель: Не только предсказание, но и рекомендация оптимальных решений.
Методы:
Оптимизация (линейное программирование).
Сценарное моделирование.
Симуляция Монте-Карло.
Применение: Логистика, управление ресурсами, инвестиции.

29. Lean Data Science

Принципы:
Минимизация затрат на сбор данных (только необходимые метрики).
Быстрое тестирование гипотез с минимальным MVP.
Устранение "мусорных" этапов в пайплайнах.
Применение: Стартапы с ограниченными ресурсами, эксперименты.

30. Explainable AI (XAI) Framework

Методы:
SHAP, LIME (интерпретация моделей).
Создание прозрачных моделей (например, деревья решений вместо "черных ящиков").
Применение: Регулируемые отрасли (банки, страхование), здравоохранение.

31. Data Ethics Framework

Этапы:

Оценка этических рисков (предвзятость, приватность).
Внедрение принципов справедливости и прозрачности.
Создание этических чек-листов для проектов.

Применение: Государственные проекты, социальные инициативы.

32. Time Series Analysis Framework

Методы:
ARIMA, Prophet, LSTM.
Этапы: декомпозиция, проверка стационарности, прогнозирование.
Применение: Прогнозирование продаж, анализ спроса, энергетика.

33. Data Monetization Framework

Этапы:

Идентификация ценных данных.
Упаковка в продукты (API, дашборды, отчеты).
Выбор модели монетизации (подписка, pay-per-use).

Применение: Компании с избытком данных (телеком, ритейл).

34. HADI Cycles (Hypothesis, Action, Data, Insights)

Принципы:
Быстрые итерации: формирование гипотезы → действие → сбор данных → анализ.
Применение: Маркетинговые эксперименты, рост цифровых продуктов.

35. Quantitative UX Research

Методы:
Анализ поведения пользователей (клики, время на странице).
Совмещение данных с качественными исследованиями (опросы).
Применение: Оптимизация пользовательского опыта, веб-аналитика.

36. Decision Intelligence (DI)

Принципы:
Моделирование цепочек решений на основе данных.
Использование графов принятия решений (causal AI + оптимизация).
Применение: Стратегическое планирование, управление рисками, логистика.
Пример: Google’s Decision Intelligence Framework.

37. Data Valuation Framework

Цель: Оценка финансовой и стратегической ценности данных.
Методы:
Анализ ROI от данных.
Метрики: стоимость приобретения данных, потенциал монетизации.
Применение: Финансовый сектор, M&A-сделки с данными.

38. Synthetic Data Generation

Этапы:

Генерация искусственных данных (GANs, диффузионные модели).
Валидация синтетических данных на реалистичность.
Использование для обучения моделей, где реальные данные недоступны.

Применение: Медицина (анонимизация), автономные системы.

39. Data Fabric Architecture

Принципы:
Создание «ткани данных» — единого слоя для интеграции, управления и доступа к данным.
Акцент на метаданные и автоматизацию.
Применение: Крупные предприятия с распределенными данными.

40. Active Learning

Этапы:

Модель выбирает, какие данные нужны для обучения (например, спорные случаи).
Эксперт размечает выбранные данные.
Цикл повторяется для улучшения модели.

Применение: Классификация изображений, NLP с ограниченными данными.

41. Human-in-the-Loop (HITL)

Принципы:
Комбинация автоматизированного анализа и экспертной проверки.
Используется для сложных задач (например, модерация контента).
Применение: Соцсети, медицинская диагностика, юридический анализ.

42. ML Canvas

Аналогия: Как Business Model Canvas, но для ML-проектов.
Блоки:
Целевые метрики, данные, архитектура модели, риски.
Применение: Планирование ML-проектов, питчи для стейкхолдеров.

43. Data Trust Framework

Цель: Управление данными с соблюдением этики и доверия.
Принципы:
Прозрачность использования данных.
Механизмы согласия пользователей (например, GDPR).
Применение: Государственные данные, проекты с персональной информацией.

44. Quantified Self (QS)

Идея: Сбор и анализ персональных данных для самопознания.
Методы: Трекинг активности, сна, питания через IoT-устройства.
Применение: Персональная аналитика, wellness-приложения.

45. Data-Driven Scenarios (DDS)

Этапы:

Построение сценариев на основе исторических данных.
Симуляция последствий решений (например, изменение цены продукта).

Применение: Стратегический менеджмент, риск-анализ.

46. Data Observability

Принципы:
Мониторинг данных в реальном времени (качество, аномалии, дрейф).
Инструменты: Great Expectations, Monte Carlo.
Применение: Поддержка ML-моделей в продакшене.

47. Federated Learning

Идея: Обучение моделей на децентрализованных данных без их перемещения.
Этапы: Локальное обучение → агрегация весов → обновление модели.
Применение: Медицина (конфиденциальность данных), IoT.

48. Data Literacy Framework

Цель: Повышение «грамотности» сотрудников в работе с данными.
Этапы: Обучение базовым навыкам анализа, визуализации, интерпретации.
Применение: Корпоративные трансформации, data-driven культура.

49. Data Philanthropy

Принципы:
Добровольный обмен данными для решения социальных проблем (например, COVID-19).
Применение: НКО, глобальные инициативы (например, открытые данные ВОЗ).

50. Augmented Analytics

Идея: Использование AI для автоматизации анализа (NLP, AutoML).
Инструменты: Tableau Ask Data, Power BI Q&A.
Применение: Самообслуживаемая аналитика для бизнес-пользователей.

51. Data Diplomacy

Цель: Урегулирование конфликтов и сотрудничество через обмен данными.
Примеры: Климатические соглашения, управление трансграничными данными.

52. Ethical Impact Assessment (EIA)

Этапы:

Оценка этических последствий проекта.
Внедрение механизмов минимизации вреда.

Применение: AI в образовании, криминалистике.

53. Data Sculpting

Метод: Визуальное исследование данных через интерактивные 3D-модели.
Инструменты: VR-аналитика (например, NVIDIA Omniverse).
Применение: Научная визуализация, геопространственный анализ.

54. Anticipatory Analytics

Цель: Предсказание и предотвращение проблем до их возникновения.
Методы: Прогнозирование сбоев в оборудовании, киберугроз.
Применение: Промышленность, кибербезопасность.

55. Data Anthropology

Идея: Изучение данных в культурном и социальном контексте.
Пример: Анализ поведения в соцсетях для понимания трендов.

56. PDCA (Plan-Do-Check-Act) / Цикл Деминга

Исторически PDCA ассоциируется с управлением качеством и производством, но сегодня она активно применяется в data-driven проектах.

Этапы:

1. Plan (Планирование):

Определение проблемы, постановка целей.
Сбор данных для анализа (например, метрики качества процесса).
Разработка гипотез и плана действий.

2. Do (Выполнение):

Реализация плана в тестовом режиме (например, пилотный проект).
Сбор данных о результатах.

3. Check (Проверка):

Анализ данных: сравнение результатов с ожиданиями.
Выявление отклонений, причинно-следственных связей.

4. Act (Действие):

Стандартизация успешных решений.
Корректировка плана при необходимости (новые итерации цикла).

Применение в контексте данных:

Оптимизация бизнес-процессов (логистика, производство).
Управление качеством данных (например, устранение аномалий).
Внедрение data-решений: тестирование гипотез, A/B-тесты.

Почему PDCA важна для data-проектов?

Акцент на итеративность и доказательный подход (данные на этапах Check и Act).
Универсальность: подходит для интеграции с другими методологиями (например, DMAIC из Six Sigma).

Как PDCA связана с другими методологиями?

С DMAIC (Six Sigma):
Plan ≈ Define + Measure,
Do ≈ Improve,
Check ≈ Analyze + Control,
Act — продолжение цикла.
С Agile: Короткие итерации PDCA могут быть встроены в спринты.
С CRISP-DM: Этапы Business Understanding и Evaluation пересекаются с Plan и Check.

56. TQM (Total Quality Management)

Принципы:
Управление качеством через вовлечение всех сотрудников.
Акцент на данные для анализа процессов (метрики дефектов, время выполнения).
Этапы:

Определение целей качества.
Сбор данных о процессах.
Анализ отклонений.
Внедрение улучшений.
Постоянный мониторинг.

Применение: Производство, сервисные компании, data-driven оптимизация процессов.

57. 8D (Eight Disciplines)

Этапы:

Формирование команды.
Описание проблемы (с использованием данных).
Временные решения.
Root Cause Analysis (анализ первопричин через данные).
Постоянные решения.
Внедрение и валидация.
Предотвращение повторения.
Празднование успеха.

Применение: Инженерные задачи, устранение дефектов в продуктах.

58. OGSM (Objectives, Goals, Strategies, Measures)

Структура:
Objectives (стратегические цели).
Goals (измеримые KPI).
Strategies (действия для достижения).
Measures (метрики и данные для отслеживания).
Применение: Стратегическое планирование с опорой на данные, корпоративная аналитика.

59. SIPOC (Suppliers, Inputs, Process, Outputs, Customers)

Цель: Визуализация процессов для выявления узких мест.
Этапы:

Картирование цепочки: поставщики → входы → процесс → выходы → клиенты.
Сбор данных на каждом этапе (например, время, стоимость).

Применение: Оптимизация бизнес-процессов, интеграция с Six Sigma.

60. 5 Whys (Пять «Почему?»)

Принцип: Итеративное выявление корневых причин проблемы.
Пример:
Проблема: «Клиенты жалуются на задержки доставки».
Почему? → «Склад работает медленно».
Почему? → «Автоматизация не внедрена» → и т.д.
Применение: Быстрый анализ данных инцидентов, старт для более глубокого исследования.

61. Root Cause Analysis (RCA)

Методы:
Диаграмма Исикавы (рыбья кость).
FMEA (анализ видов и последствий отказов).
Этапы:

Сбор данных о проблеме.
Поиск первопричин.
Планирование корректирующих действий.

Применение: Расследование инцидентов в IT, здравоохранении, логистике.

62. Lean Six Sigma

Комбинация: Lean (устранение потерь) + Six Sigma (снижение вариативности).
Этапы (DMAIC):

Define: Определение проблемы через данные.
Measure: Сбор метрик.
Analyze: Поиск причин.
Improve: Внедрение решений.
Control: Мониторинг результатов.

Применение: Оптимизация цепочек поставок, снижение затрат в data-intensive процессах.

63. Theory of Constraints (TOC)

Принципы:
Выявление «узких мест» в системе через данные.
Пример: Анализ данных о загрузке производственных линий.
Этапы:

Идентификация ограничения.
Эксплуатация ограничения.
Подчинение системы ограничению.
Повышение пропускной способности.
Повторение цикла.

Применение: Логистика, управление проектами.

64. Cynefin Framework

Категории проблем:
Простые: Четкие причинно-следственные связи (решение через лучшие практики).
Сложные: Требуется анализ данных и эксперименты (например, A/B-тесты).
Запутанные: Нет очевидных решений → нужен сбор дополнительных данных.
Применение: Принятие решений в условиях неопределенности, кризисные ситуации.

65. OKR (Objectives and Key Results)

Структура:
Objective (цель): «Увеличить точность прогнозирования спроса».
Key Results (ключевые результаты): «Снизить MAE на 15% к Q4».
Применение: Управление data-проектами, постановка измеримых целей.

66. BPM (Business Process Management)

Этапы:

Моделирование процесса (BPMN).
Внедрение автоматизации (сбор данных).
Мониторинг через BI-инструменты.
Оптимизация на основе аналитики.

Применение: Цифровая трансформация, RPA (роботизация процессов).

67. ADKAR (Awareness, Desire, Knowledge, Ability, Reinforcement)

Цель: Управление изменениями через данные.
Этапы:

Awareness: Анализ данных о текущих проблемах.
Desire: Демонстрация выгод через метрики.
Knowledge: Обучение сотрудников работе с новыми инструментами.
Ability: Внедрение решений с поддержкой данных.
Reinforcement: Мониторинг результатов.

Применение: Внедрение data-культуры в организациях.

68. Master Data Management (MDM)

Цель: Создание единого источника достоверных данных.
Этапы:

Идентификация ключевых данных (например, клиенты, продукты).
Очистка и стандартизация.
Интеграция в единую платформу.
Политики обновления и доступа.

Применение: Корпорации с распределенными данными (банки, ритейл).

69. Hoshin Kanri (Политическое развертывание)

Принципы:
Выравнивание стратегических целей компании с операционными метриками.
Использование данных для каскадирования целей по уровням.
Применение: Стратегическое управление в data-driven компаниях.

70. Data Governance Framework

Компоненты:
Политики управления данными.
Роли и ответственности (Data Owner, Steward).
Инструменты мониторинга (качество, безопасность).
Применение: Регулируемые отрасли (финансы, здравоохранение).

71. Scrum (адаптированный для Data Science)

Принципы:
Работа в спринтах (2-4 недели) с фокусом на MVP.
Ежедневные стендапы, бэклог задач.
Применение: Управление data-проектами с итеративной разработкой моделей.

72. Kanban (для DataOps)

Принципы:
Визуализация workflow (To Do → In Progress → Done).
Ограничение задач в работе (WIP).
Применение: Управление ETL-пайплайнами, мониторинг данных.

73. MoSCoW Prioritization

Категории:
Must have (критические данные/метрики).
Should have, Could have, Won’t have.
Применение: Расстановка приоритетов в data-проектах.

74. Tufte’s Principles of Data Visualization

Правила:
Минимизация «визуального шума».
Максимальная информационная плотность.
Применение: Создание отчетов и дашбордов.

75. Reinforcement Learning (RL) Framework

Этапы:

Определение среды и агента.
Обучение через trial & error.
Оптимизация политики действий.

Применение: Робототехника, игровые AI, рекомендательные системы.

76. Transfer Learning Framework

Принцип: Использование предобученных моделей (например, BERT) для новых задач.
Применение: NLP, компьютерное зрение при ограниченных данных.

77. Risk Management Framework (RMF)

Этапы:

Идентификация рисков через данные.
Оценка вероятности и воздействия.
Планирование митигации.

Применение: Финансы, кибербезопасность.

78. GitOps (для Data & ML)

Принципы:
Инфраструктура как код (IaC).
Версионирование данных и моделей через Git.
Применение: Управление ML-пайплайнами.

79. Jobs-to-be-Done (JTBD) + Data

Идея: Анализ данных о том, как пользователи «нанимают» продукт для решения задач.
Применение: Продуктовая аналитика, улучшение UX.

80. System Thinking

Принципы:
Моделирование систем через петли обратной связи.
Анализ данных в контексте целой системы.
Применение: Устойчивое развитие, экология.

81. Data Hygiene Framework

Этапы:

Регулярная очистка данных от дубликатов.
Архивирование устаревших данных.
Контроль доступа.

Применение: CRM-системы, базы клиентов.

82. Customer Journey Analytics

Методы:
Сбор данных о всех точках касания с клиентом.
Выявление узких мест через анализ пути.
Применение: Маркетинг, сервисные компании.

83. DevOps for Data (DataDevOps)

Принципы:
Интеграция разработки, тестирования и деплоя данных.
Автоматизация CI/CD для дата-пайплайнов.
Применение: Облачная аналитика, быстрое внедрение моделей.

84. Dark Data Analysis

Идея: Анализ неиспользуемых данных (логи, архивные файлы).
Применение: Поиск скрытых паттернов, оптимизация затрат.

85. Data Equity Framework

Цель: Обеспечение справедливого доступа и использования данных.
Применение: Социальные проекты, государственные программы.

86. Quantitative Risk Assessment (QRA)

Методы:
Моделирование рисков через Monte Carlo.
Анализ сценариев.
Применение: Страхование, инвестиции.

87. Data Fusion

Принцип: Объединение данных из разнородных источников (сенсоры, тексты).
Применение: IoT, умные города.

88. Multi-Armed Bandit (MAB)

Идея: Динамическое распределение трафика между гипотезами.
Применение: Оптимизация рекламных кампаний, A/B-тесты.

89. Data Curation

Этапы:

Отбор релевантных данных.
Аннотирование и обогащение метаданными.

Применение: Научные исследования, цифровые библиотеки.

90. Data Virtualization

Принцип: Доступ к данным без физической интеграции (через API).
Применение: Корпоративная аналитика с распределенными данными.

91. Failure Mode and Effects Analysis (FMEA)

Этапы:

Оценка потенциальных сбоев в data-пайплайнах.
Расчет приоритетности рисков (RPN).

Применение: Надежность ML-систем.

92. Data Lineage Tracking

Цель: Отслеживание происхождения данных и их преобразований.
Инструменты: Apache Atlas, IBM InfoSphere.
Применение: Регуляторная отчетность (GDPR).

93. First Principles Thinking + Data

Идея: Решение проблем через декомпозицию на базовые принципы и проверку данных.
Пример: Анализ причин падения продаж «с нуля».

94. Data Democratization Framework

Принципы:
Самообслуживаемый доступ к данным для сотрудников.
Обучение не-технических пользователей.
Применение: Корпорации, стартапы.

95. Real-Time Analytics Framework

Технологии:
Apache Kafka, Apache Flink.
Стриминговая обработка.
Применение: Финтех, кибербезопасность.

96. Data Classification Framework

Этапы:

Категоризация данных (публичные, конфиденциальные).
Тегирование и защита.

Применение: Управление данными в банках, госсекторе.

97. Gamification Analytics

Методы:
Анализ поведения пользователей в геймифицированных системах.
Оптимизация механик через A/B-тесты.
Применение: EdTech, мобильные приложения.

98. Data Impact Assessment

Цель: Оценка влияния данных на бизнес-решения.
Метрики: ROI от data-инициатив, влияние на KPI.

99. Data Benchmarking

Принцип: Сравнение данных компании с индустриальными эталонами.
Применение: Бенчмаркинг производительности, качество сервиса.

100. Cognitive Computing Framework

Технологии:
NLP, компьютерное зрение, нейросети.
Платформы: IBM Watson, Google DeepMind.
Применение: Медицинская диагностика, анализ текстов.