413 подписчиков
В этом материале покажем последовательность получения облака тегов, которое интересно проиллюстрирует наиболее важные слова или словосочетания из выбранной области. Часть 1. Создание совокупности текстов для обработки и последующей визуализации. Для этого можно использовать аннотации статей по заданной теме, найденные, например, в базах elibrary (см. https://www.elibrary.ru/) или Киберленинка (см. https://cyberleninka.ru/), желательно при этом использовать публикации хотя бы уровня ВАК. Также возможен...
6 месяцев назад
49,1K подписчиков
Льву Толстому приготовиться Мы уже анализировали самые частые слова в тексте, но делали это быстро, на коленке и с помощью Экселя. Теперь подойдём к этому серьёзно и используем дата-сайенс и Python — с ним такой анализ будет проще, быстрее и эффективнее. Заодно научимся делать такое красивое облако самых частых слов — это из первого тома «Войны и мира»: Что делаем Сегодня мы проанализируем текст всех томов «Войны и мира» и посмотрим, изменятся ли самые частые слова, как это будет выглядеть в облаке...
1 год назад