Найти тему

Dataviz в Машинном обучении простыми словами

Фото: Ilona Frey / Unsplash Машинн
Фото: Ilona Frey / Unsplash Машинн

Визуализация данных — это графическое представление информации. Используя диаграммы, графики и карты – инструменты визуализации данных предоставляют способ увидеть и понять тенденции, Выбросы (Outlier) и закономерности в данных.

-2

В мире Больших данных (Big Data) технологии визуализации необходимы для анализа огромных объемов информации и принятия решений.

Преимущества хорошей визуализации данных

Наши глаза тянутся к цветам и узорам. Мы можем быстро отличить красный от синего, квадрат от круга. Наша культура визуальна, включая все, от искусства и рекламы до телевидения и фильмов. Визуализация данных — это еще одна форма изобразительного искусства, которая вызывает у нас интерес и удерживает наше внимание. Когда мы видим диаграмму, то быстро обнаруживаем тенденции и выбросы. Если мы можем что-то увидеть, то быстрее усваиваем это. Если вы когда-либо смотрели на огромную таблицу и не могли увидеть тенденцию, пока не визуализировали ее, то вы знаете, насколько действенной может быть визуализация.

По мере того, как «эпоха больших данных» набирает обороты, визуализация становится все более важным инструментом для осмысления триллионов строк данных, генерируемых каждый день. Визуализация данных помогает рассказывать истории, преобразовывая данные в более удобную для понимания форму, выделяя тенденции и отклонения. Хорошая визуализация рассказывает историю, удаляя шум из данных и выделяя полезную информацию.

Почему визуализация данных важна для любой карьеры

Трудно представить себе профессиональную отрасль, которая не выигрывает от того, что делает данные более понятными. Каждая область выигрывает от понимания данных: управление, финансы, маркетинг, история, потребительские товары, сфера услуг, образование, спорт и так далее. Хотя всегда будут поэтически восхвалять визуализацию данных, существуют практические, реальные приложения, которые неоспоримы. И, поскольку визуализация настолько распространена, это также один из самых полезных профессиональных навыков для развития. Чем лучше вы можете передать свои мысли визуально, будь то на панели инструментов или в виде слайдов, тем лучше вы сможете использовать эту информацию. Наборы навыков меняются, чтобы приспособиться к миру, управляемому данными. Для профессионалов становится все более ценным иметь возможность использовать данные для принятия решений и использовать визуальные эффекты. В то время как традиционное образование обычно проводит четкую грань между творческим "рассказыванием историй" и техническим анализом, современный профессиональный мир также ценит тех, кто может скрестить эти два понятия: визуализация данных находится прямо посередине анализа и визуального сторителлинга.

Когда вы думаете о визуализации данных, ваша первая мысль, вероятно, сразу же приходит к простым Гистограммам (Histogram) или Круговым диаграммам (Piechart). Простые графики — это только верхушка айсберга. Существует целый набор методов визуализации:

  • Графики
  • Таблицы
  • Карты
  • Инфографика
  • Дашборды (Dashboard)

Выделяют множество видов графиков, вот некоторые из них:

  • Диаграмма области (Area Chart)
  • Столбцовая диаграмма (Bar Chart)
  • Ящик с усами (Boxplot)
  • Пузырьковая диаграмма (Bubble Cloud)
  • Пулевой график (Bullet Graph)
  • Картограмма (Cartogram)
  • Круговая диаграмма (Circle View)
  • Карта распространения (Dot Distribution Map)
  • Диаграмма Ганта (Gantt Chart)
  • Тепловая карта (Heat Map)
  • Таблица с тепловой картой (Highlight Table)
  • Гистограмма
  • Матрица (Matrix)
  • Сетевая диаграмма (Network)
  • Радиальная диаграмма (Polar Area)
  • Радиальное дерево (Polar Tree)
  • Потоковый граф (Streamgraph)
  • Сводная таблица (Pivot Table)
  • Таймлайн (Timeline)
  • Древовидная диаграмма (Treemap)
  • Облако слов (Word Cloud)

Автор оригинальной статьи: tableau.com