Найти тему
Стать аналитиком

Аналитик: практика. Облако тегов

Привет! Сегодня расскажу, как можно создать интересную диаграмму - "облако слов".

Какие выводы можно сделать? На 5-месячном периоде Олег обогнал Аркадия и Оксану с Глебом. Любовь упоминалась реже, чем вирус и секс.
Какие выводы можно сделать? На 5-месячном периоде Олег обогнал Аркадия и Оксану с Глебом. Любовь упоминалась реже, чем вирус и секс.

Данный вид диаграмм используют для анализа текстов от стихов и песен до речи президента. Наглядно, необычно, большой простор для фантазии. Возьму несколько песен Little BIG:

Несложно догадаться, какие песни здесь представлены
Несложно догадаться, какие песни здесь представлены

Самый простой способ создать "облако слов" из собранных данных - воспользоваться онлайн сервисами. Попробуй создать диаграмму для трёх моих статей.

-3

Приложив некоторые усилия можно сотворить очень интересные диаграммы. Несомненно существует отдельный вид искусства.

В своём примере решил пойти по более сложному пути и использовать несколько программ. Путь выглядел так:

-4

Скрипт на популярном языке программирования Python использовал для сбора данных (парсинга, скраппинга) с сайта https://poetory.ru/all , на котором публикуются все стихи из группы VK "Пирожки+".

Небольшой скрипт python для моего примера
Небольшой скрипт python для моего примера

Если будут нужны исходники, выложу.

В Photoshop лишь обрезал и преобразовал картинку пирожка в png-формат (сделал фон прозрачным). Можно было сразу маску сделать в Ps (3 строки в WM).

Wolfram Mathematica интересное ПО с большими возможностями и хорошо документировано. Например, в фильме "Прибытие" (Arrival) WM использовали для создания и отображения "языка пришельцев". Помимо большого количества примеров в разделе помощи, встречаются интересные примеры в сети.

Notebook для моего примера в Wolfram Mathematica
Notebook для моего примера в Wolfram Mathematica

В моем примере больше времени было потрачено на сбор данных (включая написание и отладку скрипта), чем на преобразование в диаграмму. С использованием онлайн сервисов разница оказалась бы ещё заметнее.

Спасибо за внимание! Подписывайся - будет ещё интереснее!