Найти в Дзене
Как устроены медиа

Как отследить трафик из AI-платформ

Как отследить трафик из AI-платформ Сервисы аналитики Similarweb и Semrush разрабатывают инструменты, которые показывают объём цитирования конкретных сми в ответах больших LLM — ChatGPT, Perplexity, AI Overviews и иже с ними. Откуда берутся данные Есть два основных источника, которыми пользуются сервисы аналитики: 1) Search APIs + “synthetic prompts” Провайдеры используют поисковые API, которые прогоняют миллионы синтетических промптов ежедневно — чтобы собирать ответы AI-поиска и видеть, где/когда в них появляются упоминания брендов и ссылки-цитирования. 2) Clickstream-данные из браузерных расширений Сервисы покупают clickstream, собранный через расширение Chrome extension, установленное у пользователей. Затем сервисы аналитики агрегируют реальные пользовательские формулировки в более крупные сущности: Кластеризуют промпты → получают “широкие промпты / темы” (topic categories), удаляют персональные данные и получают «технически синтетические данные». Это смоделированные кластер

Как отследить трафик из AI-платформ

Сервисы аналитики Similarweb и Semrush разрабатывают инструменты, которые показывают объём цитирования конкретных сми в ответах больших LLM — ChatGPT, Perplexity, AI Overviews и иже с ними.

Откуда берутся данные

Есть два основных источника, которыми пользуются сервисы аналитики:

1) Search APIs + “synthetic prompts”

Провайдеры используют поисковые API, которые прогоняют миллионы синтетических промптов ежедневно — чтобы собирать ответы AI-поиска и видеть, где/когда в них появляются упоминания брендов и ссылки-цитирования.

2) Clickstream-данные из браузерных расширений

Сервисы покупают clickstream, собранный через расширение Chrome extension, установленное у пользователей.

Затем сервисы аналитики агрегируют реальные пользовательские формулировки в более крупные сущности: Кластеризуют промпты → получают “широкие промпты / темы” (topic categories), удаляют персональные данные и получают «технически синтетические данные».

Это смоделированные кластеры поверх реального поведения, а не логи конкретных запросов пользователей.

Поскольку AI-платформы не открывают данные о цитировании, точность и методологии у всех сервисов мягко говоря «неидеальна».

- - -

Источник → https://digiday.com/media/publishers-are-hunting-for-ai-prompt-data-now-theyre-starting-to-get-it-from-tk/

Чтобы понимать, как ИИ-технологии меняют сми, подпишитесь на канал AI в медиа | Дайджесты. Там новости только по этой теме, только хардкор.