Применение в контекстной рекламе, SEO и аналитике
Перед прочтением рекомендуется прочитать предыдущую статью про частотный словарь - что это такое и почему важно.
А также про n-граммы:
https://ru.wikipedia.org/wiki/N-грамма
А сегодня я расскажу о существенном апгрейде возможностей аналитики семантического ядра. Если в прошлый раз весь анализ строился на подсчете упоминаемости единичных слов, то теперь есть возможность подсчитывать не только слова, но и их сочетания, вплоть до 5-словников.
Также для 2-словников (биграмм) я добавил возможность их подсчета, не учитывая стоп-слова и считая 3-словники со стоп-словами в середине 2-словниками.
Так меню выглядит сейчас. Если раньше было 2 макроса, теперь их 12.
6 - для подсчета уникальных значений:
и 6 - для подсчета значений через второй столбец:
Как уже было описано в предыдущей статье, первые макросы скорее полезны для анализа больших массивов плоского текста, анализ через второй столбец же гораздо полезнее и более востребован в аналитике частотностей и другой статистики поисковых запросов.
Кейсы применения словарей N-грамм:
1. Анализ поисковых запросов и выявление наиболее эффективных словосочетаний
2. Проработка категорийной семантики на максимальный охват - при первичном анализе семантического ядра
3. Полуавтоматический поиск "ближайших соседей"
Как работают макросы:
1. Скачиваем статистические данные. Допустим, статистику частотностей вложенных запросов по фразе "купить холодильник" в "!точном !соответствии":
2. Выделяем два столбца без заголовков
3. Выбираем, статистику по скольки-словным сочетаниям хотим вывести и кликаем соответствующий макрос.
4. На этом этапе случается VBA-магия. Все макросы довольно шустро обрабатывают десятки тысяч строк, сотни тысяч тоже, но с сотнями нужно все же немного подождать и иметь достаточное количество памяти на компьютере.
5. Анализируем полученный результат. Если фильтровать 4-граммы по вхождению слова "холодильник", получим примерно следущее:
Нужно иметь в виду, что макросам можно давать на вход любую статистику - частотности, показы, клики, конверсии, расходы. Можно подменять столбец с исходной метрикой и пересчитывать все метрики последовательно - при каждом заходе один и тот же макрос отдаст одно и то же количество строк, а если не менять порядок исходных данных, то не будет меняться и порядок выходных данных, разниться будут только суммы метрик.
А таким будет результат, если использовать макрос без учета стоп-слов:
Почему полезен этот макрос? Он дает четкое представление о всех ближайших соседях слова "холодильник" в семантическом ядре, и в нем самые широкие запросы для расширения семантики. Стоп-слова здесь не учитываются, т.к. не учитываются и системами контекстной рекламы, если не использовать операторы.
Чтобы воспользоваться макросом, нужно скачать мою надстройку SEMTools по постоянной ссылке https://bit.ly/SEMTools и установить ее в ваш Excel (2010 и старше, на Windows) согласно инструкции