В этом материале покажем последовательность получения облака тегов, которое интересно проиллюстрирует наиболее важные слова или словосочетания из выбранной области.
Часть 1. Создание совокупности текстов для обработки и последующей визуализации.
Для этого можно использовать аннотации статей по заданной теме, найденные, например, в базах elibrary (см. https://www.elibrary.ru/) или Киберленинка (см. https://cyberleninka.ru/), желательно при этом использовать публикации хотя бы уровня ВАК.
Также возможен вариант поиска хорошей обзорной статьи на заданную тему и по ней, удалив название, аннотацию (чтобы не увеличивали значение встречаемости слов в тексте, при этом и название, и аннотация часто берутся непосредственно из текста публикации) и список литературы (чтобы в ключевые слова не вошли фамилии авторов, которые на эти темы часто пишут и на которых сослался автор обзорной публикации).
Итак, весь найденный материал необходимо поместить в единый документ, например, docx формата.
Часть 2. Непосредственная обработка.
Для этого можно использовать веб-платформу для обзора и анализа текста Voyant tools (см. https://voyant-tools.org/), загрузить туда полученный в Части 1 документ и нажать на кнопку "Показать":
Для того, чтобы убрать некоторые слова или цифры или др. символы, которые не хотите, чтобы присутствовали в облаке тегов, используйте (показано ниже, отмечено синей стрелкой):
Появится окно, в котором можно выбрать "Редактировать список", после чего вносите в список все те слова и прочее, которое нужно удалить:
Нажимаете "Сохранить", получаете обновлённый вариант облака тегов:
В Voyant tools имеются также и некоторые другие, достаточно любопытные средства визуализации полученной информации: