Урок №1. Начало работы в Tableau
В феврале 2020 года, издание Gartner опубликовало отчет, в котором Табло входит в 1 квадрант аналитических инструментов восьмой год подряд. (или: в феврале 2020 года, издание Gartner опубликовало Магический квадрант - Gartner Magic Quadrant (MQ) для платформ аналитики и бизнес-аналитики, отмечая восьмой год подряд в качестве лидера платформу Tableau.)
Tableau используют ведущие компании за рубежом, а также – компании лидеры России в своем анализе, такие как: Яндекс, Майл.ру, Авито и др.
Давайте перейдем к знакомству с платформой Tableau.
Ссылка для скачивания Tableau пробная версия на 14 дней.
После запуска программы открывается стартовая страница. Вот так она выглядит:
Прежде чем создать визуализацию и проанализировать данные, в первую очередь необходимо подключить Tableau к данным. На левой панели Connect, которая предназначена для подключения различных данных мы видим следующие разделы:
- «Search for Data» –для подключения к источникам данных с сервера – Tableau Server;
2. «To a File» – для подключения к данным, которые хранятся в файле, например, в Microsoft Excel, PDF, пространственных файлах и т.д.
3. «To a Server» – для подключения к данным, хранящимся на сервере, например, Microsoft SQL Server, Google Analytics и др.
4. «Saved Data Sources» – для подключения к источнику данных, к которому вы подключались ранее.
Сейчас, в Saved Data Sources показаны источники данных, которые были установлены вместе с программой Tableau. Кликаем на Sample-Superstore. Его также можно открыть через проводник – кликаем на Microsoft Exсel и загружаем файл Sample-Superstore.
Поле Sheets содержит листы, которые находятся в данном файле – Sample-Superstore. Перетащим Order на окошко справа.
Вот, что мы получим:
На странице отражены названия колонок и данные, которые они содержат.
Чтобы начать анализ, перейдем к Sheet 1 по всплывающей подсказке «Go to Worksheet». Рабочая страница выглядит так:
Познакомимся с панелью Data.
- Источник данных к которому мы только что подключились
- Dimensions (синие пилюли) – содержат качественные значения (например, имена, даты или географические данные). Можно использовать Dimensions, чтобы классифицировать, сегментировать и раскрывать детали в ваших данных. Dimensions влияют на уровень детализации в представлении.
- Measures (зеленые пилюли) – содержат числовые, количественные значения, которые можно измерить. Measures могут быть агрегированы. При перетаскивании Measures в представление – Tableau применяет агрегирование к этой величине (по умолчанию).
Пилюли – таблошный сленг, так называют поля из боковой панели данных. «Перетащить пилюлю» тоже самое, что «куда-то переложить поле»
Также на панели есть кнопка Search. Например, необходимо найти все поля, в которых содержится Date.
Давайте внимательно посмотрим на поля Dimensions. Видно, что есть поля, которые относятся к одним и тем же категориям, поэтому предлагаем подготовим панель данных для дальнейшего удобства в работе и сгруппировать пилюли по категориям.
Объединим поля City, Country/Region, Postal Code, State, для этого мы их выделяем (зажимаем ctrl + выбираем нужные поля), далее кликаем правой кнопкой мыши на любое выбранное поле, в открытом списке выбираем Hierarchy и кликаем на кнопку Create Hierarchy, назовем эту иерархию Location.
Также объединим другие поля: Category, Sub Category, Product Name, создадим вторую иерархию и назовем ее Product.
Есть другой способ объединения полей, это объединения с помощью папок. Давайте таким образом объединим следующие поля: Customer Name, Segment. Для этого нужно поменять тип группировки на Folder, кликаем правой кнопкой мыши на Segment (или на Customer Name), выбираем Group By и кликаем на Folder.
Мы изменили тип группировки, теперь можем создать папку, для этого кликаем правой кнопкой мыши на Segment (или на Customer Name), выбираем Create Folder, назовем ее Customer.
Теперь добавим в нее поле Customer Name (или Segment) для этого просто кликаем мышью и переносим поле в папку Customer.
Такие поля как Customer ID, Product ID, Order ID, мы не будем использовать, давайте их спрячем, для этого нужно нажать правой кнопкой мыши на соответствующие поля и выбрать Hide.
Также можем создать папку для Order Date, Ship Date, Ship Mode для этого мы их выделяем (зажимаем ctrl + выбираем нужные поля), далее кликаем правой кнопкой мыши на любое выбранное поле, в открытом списке выбираем Folders, далее кликаем на Create Folders – назовем папку Order.
Вот что у нас получилось.
В нашем первом уроке мы научились подключаться к данным, посмотрели какие данные поддерживает Tableau и преобразовали данные к виду, в котором нам будет удобно работать в следующем уроке.
Урок № 2. Как создать визуализацию?
Сегодня мы перейдем к построению вашей первой визуализации. Ранее мы подключились к данным Sample-Superstore и сгруппировали данные в иерархии и папки, для того чтобы было удобно работать.
Каким образом можно построить визуализации в Tableau?
Есть несколько способов построения визуализаций в Tableau. Давайте рассмотрим каждый из них.
- Первый способ. Для построения визуализации нужно дважды кликнуть на любую пилюлю. При данном способе Tableau автоматически выбирает, куда лучше отнести пилюлю (на полку строк – Rows, или на полку колонок – Columns), если вам это не подходит, то вы можем положить пилюлю туда, куда вам нужно.
Полками в Tableau являются поля Columns, Rows, а также различные карточки настройки визуализации, такие как Color, Text, Detail, Tooltip, которые предназначены для создания различного типа визуализации.
2. Второй способ. Можно перетащить пилюлю на полку Rows или Columns. Вот таким образом:
Чтобы убрать пилюлю с полки, можно просто перетащить ее на пустую область слева. Вот так:
3. Третий способ. Очень простой и удобный способ построения визуализации, который позволяет сделать Tableau. Для этого нужно выделить несколько полей, выделим State, Sales, Segment, далее кликаем на кнопку «Show Me», которая находится на панели инструментов.
«Show me» – кнопка, которая предназначена для выбора типа визуализации. При помощи наведения указателя мыши на тип визуализации, можно ознакомиться с минимальными требованиями для каждого типа визуализации.
Мы перешли к выбору типа визуализации, давайте выберем Horizontal Bars.
В любой момент мы можем отменить действие, с помощью кнопки «Undo», которая находится также на панели инструментов.
Давайте отменим последнее действие (создание визуализации) и рассмотрим четвертый способ построения визуализации.
4. Четвертый способ. Для этого перетаскиваем пилюлю Sales на горизонтальную ось. Вот так:
Далее, перетаскиваем пилюлю Customer на полку Rows.
Вот что у нас получилось:
Очистим холст с помощью кнопки «Clear sheet», которая находится на панели инструментов.
Итак, мы рассмотрели основные способы построения визуализаций в Tableau. Теперь давайте перейдем непосредственно к анализу данных.
Анализ данных с помощью визуализации в Tableau
Давайте посмотрим за какой период времени у нас есть данные, для этого пилюлю Order Date перенесем на полку Columns. Вот, что мы увидим:
Итак, мы видим, что у нас данные за четыре года: 2016, 2017, 2018, 2019.
Далее, перетаскиваем пилюлю Sales на полку Rows.
Для удобства увеличим масштаб нашей визуализации, для этого кликаем на кнопку «Fit», которая находится на панели инструментов и выбираем Entire View, для того чтобы визуализация занимала весь холст.
Вот что у нас получилось:
Что еще позволяет сделать Tableau, мы можем нажать на кнопку «Show Mark Labels», которая находится на панели инструментов, для отображения числовых значений точек на нашей визуализации.
Вот, что у нас получилось:
Итак, этот линейный график показывает ежегодный объем продаж за весь период. Например, в 2017 году, объем продаж составил 470 533$.
Для более детального анализа перетаскиваем пилюлю Category на полку Columns кладем ее справа от (YEAR) Order Data. Добавив второе качественное значение (синюю пилюлю) к нашей визуализации мы получили гистограмму вместо линейного графика, которая отражает объем продаж для каждой категории продуктов по годам.
Вот что у нас получилось:
Итак, видно, что категория Technology имеет самые высокие показатели объемов продаж в течении всего периода. Сравним категории Furniture и Office Supplies, мы видим, что объемы продаж категории Furniture растут быстрее, чем продажи категории Office Supplies. Несмотря на то, что категория Office Supplies имела хороший показатель в 2019 году.
Теперь, давайте попытаемся понять причину, и за счет каких продуктов в 2019 году категория Office Supplies имела хороший показатель. Для этого перетаскиваем пилюлю Sub-category на полку Columns. Пилюля Sub-category (синяя пилюля), которая имеет качественное значение. Поэтому мы получили гистограмму, которая отражает объемы продаж продуктов за весь период, включенных в категории Technology, Furniture и Office Supplies. То есть, получили более детальную визуализацию данных.
Вот что у нас получилось:
Однако получилось очень большое количество данных (точек), которые анализировать не удобно.
В этом уроке мы рассмотрели способы построения визуализаций в Tableau с различным уровнем детализации, а также выяснили, что анализировать большое количество данных (точек) не удобно. Поэтому в следующем уроке мы научимся применять фильтры и цветовое выделение для того, чтобы было удобнее анализировать наши данные.
Урок № 3. Применение фильтров и цвета в Tableau
Сегодня мы научимся применять фильтры и цвета для того, чтобы было проще анализировать данные.
Раннее мы рассмотрели несколько способов построения визуализации и построили нашу первую визуализацию. В построенной визуализации мы получили много данных, которые сложно анализировать.
- Давайте добавим фильтры для Order Date и Sub-Category.
Для этого мы кликаем правой кнопкой мыши по полю Order Date и выбираем Show Filter. Также добавим фильтр для Sub-Category. Вот, что у нас получилось:
Видим, что суммы продаж по определенным продуктам, очень низкие. Мы могли бы посоветовать прекратить их продавать, но давайте разберемся получше. Перетаскиваем поле Profit на карточку цвета, чтобы наглядно посмотреть прибыль, которую приносят продукты.
Вот, что у нас получилось:
Видим, что некоторые продукты убыточные. Чтобы проанализировать убыточные продукты, давайте воспользуемся фильтром и выберем их. В фильтре Sub-Category снимем галочку с All, и выберем Bookcases, Machines и Tables.
Итак, что у нас получилось:
Видно, что в некоторые годы рассматриваемые продукты были прибыльными. Чтобы разобраться в этом более детально, перетащим поле Region на полку Rows. И вот, что мы увидим - представление с несколькими осями, разбитыми по регионам:
По интенсивности цвета можно говорить о прибыльности или убыточности продукта в конкретном регионе. Видим, что наибольшие убытки от продажи в 2019 году продукта Machines приходились на South Region. Чтобы сохранить визуализацию, кликните дважды на Sheet 1 и назовите визуализацию, мы назовем ее Sales by Product/Region. Далее создадим копию рабочего листа, для этого кликаем правой кнопкой мыши на Sales by Product/Region и выбираем Duplicate.
Далее в скопированном рабочем листе добавим фильтр по регионам, для этого кликаем правой кнопкой мыши на пилюлю Region и выбираем Show Filer. В фильтры снимаем галочку с All и выбираем South Region. Вот, что у нас получилось:
Назовем этот рабочий лист Sales in the South. Чтобы сохранить сделанный прогресс кликаем на File, выбираем Save As и сохраняем рабочую книгу. Готово! В этом уроке мы использовали фильтры и выделение цветом, чтобы сфокусироваться на важных и нужных для нас данных.
Урок № 4. Географический анализ
В прошлом уроке мы создали визуализации, которые показывают продажи и прибыль за несколько лет, а также поняли, что в South Region продажи продукта Machine являются убыточными и сегодня мы рассмотрим, как с помощью построения карт можно проанализировать такую ситуацию.
Так как в наших данных содержится информация о регионах, и мы анализируем South Region, можно создать представление в виде карты. Давайте создадим новый лист и дважды кликаем на пилюлю State.
Вот, что у нас получилось:
Tableau автоматически добавляет поле Country/Region на нашу визуализацию, это связано с тем, что поле Country является частью иерархии, которая называется Location. Также на визуализацию были автоматически добавлены поля Longitude и Latitude, так как мы кликнули на поле State, которое имеет географический тип.
Существует несколько географических ролей их можно настраивать самостоятельно. Географическими ролями являются страны, штаты, города и так далее.
Давайте раскрасим нашу карту в зависимости от объема продаж, для этого перетаскиваем пилюлю Sales на карточку Color.
Для того, чтобы посмотреть какие штаты преуспевают в продажах, а какие не справляются, давайте для нашего удобства поменяем палитру. Для этого кликаем на SUM(Sales) в правом верхнем углу и выбираем Edit Colors.
Далее, в списке выбираем Red-Green Diverging. И кликаем ОК.
Так как мы хотели проанализировать конкретный регион South Region добавим фильтр для поля Region и выберем нужный регион. Вот, что у нас получилось:
Видим, что большая часть штатов имеет низкие продажи, с чем это может быть связано? Это может быть связано с тем, что в штатах мало магазинов, или маленькое население. Для более детального анализа нужно добавить на наше представление поле Profit, чтобы проанализировать прибыльность штатов. Для этого уберем поле SUM(Sales) с карточки цвета, вот так:
Далее перетащим пилюлю Profit на карточку цвета Color. Вот, что у нас получается:
Наводим курсор на убыточные штаты и видим краткое описание Country, State, Profit. Итак видно, что штаты Florida, North Carolina, Tennessee имеют отрицательную прибыль, то есть убытки. Давайте разберемся, с чем это связано?
В этом уроке мы научились строить карты. В следующем уроке мы сосредоточимся на этих трех убыточных штатах и проанализируем их.
Урок № 5. Анализ убыточных городов (горизонтальные столбцы)
Давайте назовем рабочий лист с картой прошлого урока Profit Map и продублируем его.
Далее изменим тип визуализации, для этого кликаем на кнопку Show me и выбираем Horizontal bars.
Мы видим три штата с отрицательной прибылью, давайте на них сфокусируемся, для этого выделим их и во всплывающем окошке выберем Keep only.
Вот, что у нас получилось:
В поле Filters появилась пилюля Inclusions (Country/Region, State) которая имеет аргументы Country и State. Давайте посмотрим на конкретные города, для этого кликаем на «+» на пилюле State, которая находится на полке Rows. Вот, что мы увидим:
Городов очень много, поэтому предлагаем сфокусироваться на убыточных городах для этого мы зажмем клавишу Ctrl и перетащим пилюлю City с полки Rows на карточку Filters.
В открывшемся окне для настройки фильтра выберем Top и выберем следующие настройки:
То есть пять городов с наименьшей прибылью.
Мы увидим пустой лист, это связано с тем, что мы использовали несколько фильтров, Tableau любые операции выполняет в определенном порядке.
Сначала Tableau выполняет фильтр City, при помощи которого оставил пять городов с наименьшей прибылью или с наибольшим убытком) а затем применяет фильтр, в котором оставил три штата, мы же хотим, чтобы Tableau сначала выполнил фильтр оставив три штата, а затем из этих штатов выбрал пять городов с наименьшей прибылью. Для того, чтобы поменять порядок выполнения фильтров, кликаем правой кнопкой мыши на фильтр Inclusion (Country, State) и выбираем Add to Context. Вот, что у нас получилось:
Но мы видим на представлении город, который имеет положительную прибыль. Чтобы его убрать с представления, давайте увеличим уровень детализации, для этого кликаем на «+» на пилюле City, которая находится на полке Rows. Появилась пилюля Postal Code. Далее кликаем правой кнопкой мыши на почтовый индекс города, который хотим исключить и выбираем Exclude.
Вот, что у нас получилось:
Теперь можно убрать пилюлю Postal Code с полки Rows. Далее давайте посмотрим какие категории продуктов дают нам отрицательную прибыль. Для этого мы перетаскиваем пилюлю Sub-Category на полку Rows, и перетаскиваем пилюлю Profit на карточку цвета Color.
Вот, что у нас получилось:
Мы видим, что такие продукты как Machines, Tables, Binders. Давайте подтвердим полученный результат. Для этого перейдем на рабочий лист Profit map. Добавим фильтр для Sub-Category и снимем галочки с убыточных продуктов. Вот, что должно получиться:
Видим, что раскраска на карте показывает, что все штаты приносят прибыль.
В этом уроке мы углубились в анализ, использовали фильтры и смогли определить убыточные категории продуктов.
Урок № 6. Как построить дашборд?
Сегодня мы построим дашборд, чтобы показать результат нашего анализа коллегам или руководителю.
Итак, кликаем на вкладку New Dashboard.
Вот, что мы увидим:
Перетаскиваем рабочий лист Sales in the South (из Sheets) на дашборд, а также Profit map. Вот, что у нас получилось:
Далее выбираем автоматический размер, для кликаем на Size и выбираем Automatic.
Теперь, наведем красоту. Уберем заголовки на дашборде для этого кликаем по заголовку и снимаем галочку с Show Header.
Далее скроем фильтры, которых получилось на дашборде слишком много. Кликаем на «×» каждого фильтра. Оставим следующие фильтры для: Year of Order Data, Profit, Sub-Category, Region. Вот, так теперь выглядит наш дашборд:
Далее, перетаскиваем фильтр для Profit в самую нижнюю часть дашборда.
Далее сделаем фильтр для выбора даты Year of Order Data плавающим, чтобы перемещать его в любое пространство на дашборде, для этого кликаем правой кнопкой мыши по фильтру и выбираем Floating. И перетаскиваем на представление.
Далее настроим фильтры так, чтобы они применялись ко всем листам на нашем дашборде. Для этого кликаем на фильтр для Region и далее кликаем на Apply to Worksheets и выбираем All Using This Data Source.
Далее изменим цветовую палитру для фильтра Profit (двухцветную красно-зеленую которую мы использовали ранее).
Tableau позволяет настраивать интерактивность дашборда, для этого нам нужно кликнуть на визуализации Profit map и Sales in the South и выбрать Use as Filter.
Теперь кликая на штаты на карте мы видим продажи в этом штате.
Готово, наш первый дашборд!
Урок № 7 . Визуализация для KPI.
Для построения KPI визуализации будем использовать источник данных Sample-Superstore.
Перетаскиваем пилюлю Region на полку Columns. Далее перетаскиваем пилюлю Sub-Category на полку Rows. Также перетаскиваем пилюлю Sales на карточку Text. Вот, что у нас получилось:
Отобразим нашу визуализацию на полный экран:
Итак, мы хотим задать порог, чтобы выяснить были достигнуты определенные результаты или нет. Например, установим порог 25000, если объем продаж выше этого показателя это говорит об эффективности продаж, если ниже – это говорит о неэффективности продаж.
Для этого необходимо создать вычисляемое поле, для этого кликаем на Analytics и выбираем Create Calculated Field. Назовем его KPI_Color. Введем следующую формулу и кликаем ОК.
IF SUMSales>= 25000 THEN 'Above benchmark'
ELSE 'Under benchmark' END
Теперь выбираем тип метки (Marks) Shape. Далее перетаскиваем пилюлю KPI_Color на карточку Shape. Вот, что у нас получилось:
Далее, кликаем на карточку Shape.
Далее выбираем KPI Shape Palette:
Для Above benchmark выбираем:
Для Under benchmark выбираем:
И переносим пилюлю Sales на карточку Detail. Вот, что у нас получилось:
Мы построили визуализацию для отражения KPI, она не является полноценным дашбордом, но может быть полезна как дополнение к отчету KPI.
Урок № 8. Year over year growth
Сегодня мы построим визуализацию сравнения продаж текущего и предыдущего года. Будем использовать источник данных Sample-Superstore.
Для этого мы перетаскиваем Order Date на полку Columns, далее кликаем на «+» на пилюле YEAR (Order Date), далее появится QUARTER (Order Date) – также кликаем на «+» на пилюле QUARTER (Order Date), и появится MONTH (Order Date).
Уберем QUARTER (Order Date). Оставим YEAR (Order Date) и MONTH (Order Date).
Далее перетаскиваем поле Sales на полку Rows. Чтобы посчитать изменения продаж с предыдущим годом (периодом), Tableau предоставляет очень удобную функцию, для этого кликаем правой кнопкой мыши на пилюлю Sales, которая находится на полке Rows, далее кликаем на Quick Table Calculation и выбираем Year Over Year Growth.
Если мы выполним эту операцию, то останутся только Year Over Year Growth. Чтобы отразить также непосредственно величину продаж переносим Sales на полку Rows перед пилюлей SUM(Sales).
Далее, нужно совместить два этих показателя объем продаж и изменение продаж. Для этого кликаем правой кнопкой мыши на SUM(Sales) – который находится справа и выбираем Dual Axis.
Вот, что у нас получилось:
Видим, что в 2016 году нам не с чем сравнивать продажи, поэтому давайте скроем этот год. Если мы просто применим годовой фильтр и уберем 2016 год, у нас не будет данных для сравнения 2017 года с предыдущим годом. Поэтому необходимо скрыть 2016 год следующим образом:
Далее переносим созданное поле INDEX() на полку Filters.
Теперь кликаем на поле INDEX, выбираем Edit Table Calculation.
Далее выбираем Specific Dimensions и снимаем галочку с Month of Order Date.
Далее также кликаем на INDEX и выбираем Edit Filter.
Теперь выбираем диапазон от 2 до 4. Таким образом мы скроем 2016 год, который имеет индекс 1.
Вот, что мы получим:
Далее мы можем цветом показать Year over year growth, для этого перенесем пилюлю SUM (Sales) которая находится справа на полке Rows на карточку Color. Вот, что должно получиться:
Далее изменим палитру на двухцветную красно-зеленую. Для этого кликаем на %Difference in SUM (Sales) в правом верхнем углу и кликаем на Edit Colors.
Вот, что должно получиться:
Далее, чтобы мы могли сравнивать значения продаж для разных лет, давайте добавим такой Action как подсветка. Кликаем на Worksheet и выбираем Action.
Далее кликаем на Add Action и выбираем Highlight.
Выбираем следующее:
Давайте проверим, как это работает, для этого кликаем на январь и видим что январь выделяется и для других периодов (годов).
Готово! Проверим, как работает наша визуализация.
Например, мы видим, что в 2018 году в августе продажи упали на 15,7% по сравнению с 2017 годом, объем продаж составил 31 115 $.