Найти тему

Частотный словарь n-грамм в семантическом ядре

Применение в контекстной рекламе, SEO и аналитике

Перед прочтением рекомендуется прочитать предыдущую статью про частотный словарь - что это такое и почему важно.
А также про n-граммы:
https://ru.wikipedia.org/wiki/N-грамма

А сегодня я расскажу о существенном апгрейде возможностей аналитики семантического ядра. Если в прошлый раз весь анализ строился на подсчете упоминаемости единичных слов, то теперь есть возможность подсчитывать не только слова, но и их сочетания, вплоть до 5-словников.

Также для 2-словников (биграмм) я добавил возможность их подсчета, не учитывая стоп-слова и считая 3-словники со стоп-словами в середине 2-словниками.

Так меню выглядит сейчас. Если раньше было 2 макроса, теперь их 12.
6 - для подсчета уникальных значений:

и 6 - для подсчета значений через второй столбец:

-2

Как уже было описано в предыдущей статье, первые макросы скорее полезны для анализа больших массивов плоского текста, анализ через второй столбец же гораздо полезнее и более востребован в аналитике частотностей и другой статистики поисковых запросов.

Кейсы применения словарей N-грамм:

1. Анализ поисковых запросов и выявление наиболее эффективных словосочетаний

2. Проработка категорийной семантики на максимальный охват - при первичном анализе семантического ядра

3. Полуавтоматический поиск "ближайших соседей"

Как работают макросы:

1. Скачиваем статистические данные. Допустим, статистику частотностей вложенных запросов по фразе "купить холодильник" в "!точном !соответствии":

-3

2. Выделяем два столбца без заголовков

3. Выбираем, статистику по скольки-словным сочетаниям хотим вывести и кликаем соответствующий макрос.

4. На этом этапе случается VBA-магия. Все макросы довольно шустро обрабатывают десятки тысяч строк, сотни тысяч тоже, но с сотнями нужно все же немного подождать и иметь достаточное количество памяти на компьютере.

5. Анализируем полученный результат. Если фильтровать 4-граммы по вхождению слова "холодильник", получим примерно следущее:

Данные слова можно использовать в качестве ключевых, предварительно отфильтровав дубли и ненужные.
Данные слова можно использовать в качестве ключевых, предварительно отфильтровав дубли и ненужные.

Нужно иметь в виду, что макросам можно давать на вход любую статистику - частотности, показы, клики, конверсии, расходы. Можно подменять столбец с исходной метрикой и пересчитывать все метрики последовательно - при каждом заходе один и тот же макрос отдаст одно и то же количество строк, а если не менять порядок исходных данных, то не будет меняться и порядок выходных данных, разниться будут только суммы метрик.

А таким будет результат, если использовать макрос без учета стоп-слов:

-5

Почему полезен этот макрос? Он дает четкое представление о всех ближайших соседях слова "холодильник" в семантическом ядре, и в нем самые широкие запросы для расширения семантики. Стоп-слова здесь не учитываются, т.к. не учитываются и системами контекстной рекламы, если не использовать операторы.

Чтобы воспользоваться макросом, нужно скачать мою надстройку SEMTools по постоянной ссылке https://bit.ly/SEMTools и установить ее в ваш Excel (2010 и старше, на Windows) согласно инструкции