Найти тему

Создание облака тегов

Оглавление

В этом материале покажем последовательность получения облака тегов, которое интересно проиллюстрирует наиболее важные слова или словосочетания из выбранной области.

Пример облака тегов
Пример облака тегов

Часть 1. Создание совокупности текстов для обработки и последующей визуализации.

Для этого можно использовать аннотации статей по заданной теме, найденные, например, в базах elibrary (см. https://www.elibrary.ru/) или Киберленинка (см. https://cyberleninka.ru/), желательно при этом использовать публикации хотя бы уровня ВАК.

Также возможен вариант поиска хорошей обзорной статьи на заданную тему и по ней, удалив название, аннотацию (чтобы не увеличивали значение встречаемости слов в тексте, при этом и название, и аннотация часто берутся непосредственно из текста публикации) и список литературы (чтобы в ключевые слова не вошли фамилии авторов, которые на эти темы часто пишут и на которых сослался автор обзорной публикации).

Итак, весь найденный материал необходимо поместить в единый документ, например, docx формата.

Часть 2. Непосредственная обработка.

Для этого можно использовать веб-платформу для обзора и анализа текста Voyant tools (см. https://voyant-tools.org/), загрузить туда полученный в Части 1 документ и нажать на кнопку "Показать":

-2

Для того, чтобы убрать некоторые слова или цифры или др. символы, которые не хотите, чтобы присутствовали в облаке тегов, используйте (показано ниже, отмечено синей стрелкой):

-3

Появится окно, в котором можно выбрать "Редактировать список", после чего вносите в список все те слова и прочее, которое нужно удалить:

-4
-5

Нажимаете "Сохранить", получаете обновлённый вариант облака тегов:

-6

В Voyant tools имеются также и некоторые другие, достаточно любопытные средства визуализации полученной информации:

-7