Добавить в корзинуПозвонить
Найти в Дзене
Marketing in Life

Почему и как Авито меняет текст объявлений. В каких случаях это вредит Рекламодателю?

Как известно Авито - крупная рекламная платформа для продвижения продуктов и услуг. Одно из динамично развивающихся направлений это Авито.Недвижимость. В этой нише работаем и мы. Нам важно, чтобы в тексте объявлений на Авито был указан наш уникальный ID продаваемого объекта. Т.к. пользователю не всегда удобно общаться с менеджером внутри Авито, а Авито трафик "наружу" не выводит. Конструкции наших ID:
COM[ЦИФРОВОЙ КОД]; B[ЦИФРОВОЙ КОД] и. т.д. При проведении оптимизации рекламных компаний обнаружилось, что при копировании ID объекта и попытке его найти на нашем сайте - объекта имущества и нет. Выяснилось, что Авито использует систему "фуззи-нормализации" (fuzzy text sanitizing). Это подтверждается наличием открытой библиотеки github.com/avito-tech/normalize, которую компания использует для чистки и приведения текста к единому стандарту. Система автоматически применяет набор правил. Если говорить простыми словами, она делает текст "удобоваримым" для поиска. Одно из ключевых правил на
Оглавление

Как известно Авито - крупная рекламная платформа для продвижения продуктов и услуг. Одно из динамично развивающихся направлений это Авито.Недвижимость. В этой нише работаем и мы.

Avito и технологии
Avito и технологии

Проблема

Нам важно, чтобы в тексте объявлений на Авито был указан наш уникальный ID продаваемого объекта. Т.к. пользователю не всегда удобно общаться с менеджером внутри Авито, а Авито трафик "наружу" не выводит.

Конструкции наших ID:
COM[ЦИФРОВОЙ КОД]; B[ЦИФРОВОЙ КОД] и. т.д.
Пример внутреннего ID: COM20032600115
Пример внутреннего ID: COM20032600115

При проведении оптимизации рекламных компаний обнаружилось, что при копировании ID объекта и попытке его найти на нашем сайте - объекта имущества и нет.

COM20032600115
COM20032600115

Выяснилось, что Авито использует систему "фуззи-нормализации" (fuzzy text sanitizing). Это подтверждается наличием открытой библиотеки github.com/avito-tech/normalize, которую компания использует для чистки и приведения текста к единому стандарту.

GitHub - avito-tech/normalize
fuzzy text sanitizing
fuzzy text sanitizing

Как это работает (техническая сторона)

Система автоматически применяет набор правил. Если говорить простыми словами, она делает текст "удобоваримым" для поиска. Одно из ключевых правил называется CyrillicToLatinLookAlike (кириллица в латиницу). Согласно этому правилу, схожие по написанию символы приводятся к латинскому стандарту.

Примеры реальной подмены:
Вы пишете (Вводите латиницей) -> Авито показывает (Преобразует в базу данных)

Подмены контента
Подмены контента

Зачем это делать?

Обычный пользователь не знает, в какой раскладке он печатает. Человек может написать "BMW" (латиница) или "ВМW" (русская раскладка, случайно нажав Shift + Alt). Для поиска это две разные строки. Без нормализации объявление продавца, написавшего "Ваз" (с русской "В"), не найдет покупатель, который ищет "Vaz" (с латинской "V").

Цель данной функции — улучшение поиска и борьба со спамом.

  1. Повышение релевантности поиска: Пользователи часто печатают названия брендов (например, Samsung/Sumsung) или вводят текст в неверной раскладке клавиатуры ("Bmw" вместо "Вмв"). Алгоритм приводит похожие символы к единому стандарту, чтобы ваше объявление находили по правильным запросам, даже если допущена опечатка.
  2. Стандартизация данных: Приведение текста к нижнему регистру и единому алфавиту помогает нашей базе данных эффективно сортировать товары и связывать их с категориями.
  3. Безопасность и борьба со спамом: Нормализация текста помогает выявлять недобросовестные схемы, когда спамеры пытаются обойти фильтры, заменяя буквы в запрещенных словах на визуально похожие символы из другого алфавита (например, «Бесплатно» через латинскую 'B').

Ответ менеджеров Авито

Авито
Авито

Информация на отзовиках - "Странные махинации Авито"

-7

Понятно, что на крупном агрегаторе команда применяет разные алгоритмы защиты и оптимизации, но в данном случае это сработало в минус!

Как выходим из ситуации?

1. В тексте объявления начали указывать полный URL до объекта имущества на сайте

2. Рассматриваем возможность использования сервисов по укорачиванию ссылок, т.к. важно тоже понимать какой трафик пришел с Авито на сайт. Сейчас этого сделать нельзя.

3. Провели доработку OpenSearch, чтобы был Не нулевой результат при аналогичном кейсе.

Выводы

Эффективность рекламных вложений напрямую связана с пониманием как работает полный CJM с точки зрения пользователя и с точки зрения технической реализации всего процесса.