Найти в Дзене
Пульс Земли

Визуализация данных в Deductor. Как выглядят графики наглядно

Содержание: 1. Таблица Стандартное табличное представление с возможностью фильтрации данных, сортировки и быстрого расчета статистики. 2. Статистика Статистические показатели выборки. 3. Диаграмма График изменения любого показателя. Имеется возможность выбора различных вариантов диаграмм: столбчатые, линейные, круговые и прочее. 4. Многомерная диаграмма. Отображает данные в многомерном виде – поверхность или топографическим способом. 5. Диаграмма размещения Показывает объекты, размещенные в пространстве. 6 Гистограмма. График разброса показателей. Гистограмма предназначена для визуальной оценки распределения данных. Распределение данных оказывает значительное влияние на процесс построения модели. Кроме того, по гистограмме можно судить о величине отклонений различной степени. 7. Куб Многомерное представление данных. Любые данные, используемые в программе, можно посмотреть в виде кросс-таблицы и кросс-диаграммы. Пользователю доступен весь набор механизмов манипуляции многомерными данны

Содержание:

  • 1. Таблица
  • 2. Статистика
  • 3. Диаграмма
  • 4. Многомерная диаграмма
  • 5. Диаграмма размещения
  • 6. Гистограмма
  • 7. Куб
  • 8. Дубликаты и противоречия
  • 9. Матрица корреляции
  • 10. Граф нейросети
  • 11. Дерево решений
  • 12. Правила
  • 13. Значимость атрибутов
  • 14. Карта Кохонена
  • 15. Профили кластеров
  • 16. ROC-анализ
  • 17. Коэффициенты регрессии
  • 18. Популярные наборы
  • 19. Дерево правил
  • 20. Что-если
  • 21. Обучающий набор
  • 22. Диаграмма прогноза
  • 23. Таблица сопряженности
  • 24. Диаграмма рассеяния
  • 25. Диаграмма сезонных индексов
  • 26. Сведения
  • 27. Оценка качества данных
  • 28. Сэмплинг

1. Таблица

Стандартное табличное представление с возможностью фильтрации данных, сортировки и быстрого расчета статистики.

2. Статистика

Статистические показатели выборки.

-2

3. Диаграмма

График изменения любого показателя. Имеется возможность выбора различных вариантов диаграмм: столбчатые, линейные, круговые и прочее.

-3

4. Многомерная диаграмма.

Отображает данные в многомерном виде – поверхность или топографическим способом.

-4

5. Диаграмма размещения

Показывает объекты, размещенные в пространстве.

-5

6 Гистограмма.

График разброса показателей. Гистограмма предназначена для визуальной оценки распределения данных. Распределение данных оказывает значительное влияние на процесс построения модели. Кроме того, по гистограмме можно судить о величине отклонений различной степени.

-6

7. Куб

Многомерное представление данных. Любые данные, используемые в программе, можно посмотреть в виде кросс-таблицы и кросс-диаграммы. Пользователю доступен весь набор механизмов манипуляции многомерными данными – группировка, фильтрация, сортировка, произвольное размещение измерений, детализация, выбор любого способа агрегации, отображение в абсолютных числах и в процентах.

-7

8. Дубликаты и противоречия

Специальный визуализатор, сделанный на основе таблицы, для более удобного отображения результатов поиска дубликатов и противоречий.

-8

9. Матрица корреляции (под вопросом)

Отображает зависимость (корреляцию) между входными и выходными полями обработчика «Корреляционный анализ».

-9

10. Граф нейросети

Визуальное отображение обученной нейросети. Отображается структура нейронной сети и значения весов.

-10

11. Дерево решений

Отображение дерева решений, полученного при помощи соответствующего алгоритма. Имеется возможность посмотреть детальную информацию по любому узлу и фильтровать попавшие в него данные.

-11

12. Правила

Отображают в текстовом виде правила, полученные при помощи алгоритма построения деревьев решений или поиска ассоциаций. Такого рода информация легко интерпретируется человеком.

-12

13. Значимость атрибутов

Отображается степень влияния каждого входного атрибута на результат построения дерева решений. Параметр значимость тем выше, чем больше вклад вносит конкретный входной атрибут при классификации выходного поля. Фактически данный визуализатор показывает степень нелинейной зависимости между выходным и входными полями.

-13

14. Карта Кохонена

Отображение самоорганизующихся карт, построенных при помощи соответствующего алгоритма. Широкие возможности настройки – выбор количества кластеров, фильтрация по узлу/кластеру, выбор отображаемых полей. Мощный и гибкий механизм отображения кластеризованных данных.

-14

15. Профили кластеров

Статистическая информация по кластерам, которые получаются на выходе обработчиков «Карта Кохонена» и «Кластеризация k-means»

-15

16. ROC-анализ (под вопросом)

Доступен после обработчика «Логистическая регрессия». Позволяет оценить прогностическую силу модели, рассчитать оптимальный порог отсечения, проанализировать модель на чувствительность и специфичность.

-16

17. Коэффициенты регрессии

Отображает коэффициенты, рассчитанные при помощи алгоритма «Линейная регрессия» и «Логистическая регрессия».

-17

18. Популярные наборы

Отображение наиболее часто встречающихся в ассоциативных правилах множеств в виде списка с возможностью фильтрации и сортировки.

-18

19. Дерево правил

Отображение в иерархическом виде (в виде дерева) ассоциативных правил. Содержит всегда два уровня. На первом – условие, на втором – следствие правила (или наоборот).

-19

20. Что-если

Таблица и диаграмма. Позволяют «прогонять» через построенную модель любые интересующие пользователя данные и оценить влияние того или иного фактора на результат. Активно используется для решения задач оптимизации.

21. Обучающий набор

Выборка, используемая для построения модели. Выделяются цветом данные, попавшие в обучающее и тестовое множество с возможностью фильтрации. Необходима для понимания того, какие записи и каким образом использовались при построении модели.

-21

22. Диаграмма прогноза

Применяется после использования метода обработки – Прогнозирование. Прогнозные значения на диаграмме выделяются цветом.

-22

23. Таблица сопряженности

Предназначена для оценки результатов классификации вне зависимости от используемой модели. Таблица сопряженности отображает результаты сравнения категориальных значений исходного выходного столбца и категориальных значений рассчитанного выходного столбца. Используется для оценки качества классификаторов.

-23

24. Диаграмма рассеяния

График отклонения значений, прогнозируемых при помощи модели, от реальных. Может быть построена только для непрерывных величин и только после использования механизмов построения модели, например, нейросети, линейной регрессии или пользовательской модели. Используется для визуальной оценки качества построенной модели.

-24

25. Диаграмма сезонных индексов

Показывает тренд и сезонные индексы после применения обработчика «Декомпозиция временного ряда».

-25

26. Сведения

Текстовое описание параметров импорта/обработки/экспорта в дереве сценариев обработки.

-26

27. Оценка качества данных

Оценка качества данных включает в себя: импортирование данных, устранение дубликатов и противоречий, обработка пропусков (если необходимо, пропуска заполняются вручную или автоматически, проведение фильтрации.

-27

28. Сэмплинг

Используется для сведения задачи анализа всех доступных данных, что требует больших (часто неприемлемых) временных и вычислительных затрат, к анализу ограниченной выборки, в достаточной мере отражающей свойства всей исследуемой совокупности.

-28

29. Диаграмма связей

-29