Найти в Дзене
N + 1

Тайная жизнь цифровых объявлений

Большинство пользователей видят в классифайдах — цифровых досках объявлений — простую механику: зашел, нажал «Разместить», написал пару строк — и объявление уже в поиске. Но это только вершина айсберга. Самое интересное — внутри. Тут и машинный анализ текста с изображениями, и многоуровневая модерация, и алгоритмы поиска, и защищенные каналы общения, оплаты и доставки. Как все это работает, посмотрим на примере Авито: проследим за жизненным циклом одного объявления, от создания до заключения сделки. Путь объявления начинается с кнопки «Разместить объявление». В этот момент запускается процесс преобразования информации, введенной пользователем, в четкую цифровую форму. Первая задача системы — понять, что именно хочет продать человек. На Авито существует шесть основных вертикалей: товары, автомобили, недвижимость, услуги, работа и путешествия. Внутри каждой — десятки категорий и подкатегорий. Квартира в Москве и земельный участок в Сибири формально относятся к одной категории, но требуют
Оглавление

Большинство пользователей видят в классифайдах — цифровых досках объявлений — простую механику: зашел, нажал «Разместить», написал пару строк — и объявление уже в поиске. Но это только вершина айсберга. Самое интересное — внутри.

Тут и машинный анализ текста с изображениями, и многоуровневая модерация, и алгоритмы поиска, и защищенные каналы общения, оплаты и доставки. Как все это работает, посмотрим на примере Авито: проследим за жизненным циклом одного объявления, от создания до заключения сделки.

Создание объявления: как модели упорядочивают хаос

Путь объявления начинается с кнопки «Разместить объявление». В этот момент запускается процесс преобразования информации, введенной пользователем, в четкую цифровую форму.

Первая задача системы — понять, что именно хочет продать человек. На Авито существует шесть основных вертикалей: товары, автомобили, недвижимость, услуги, работа и путешествия. Внутри каждой — десятки категорий и подкатегорий. Квартира в Москве и земельный участок в Сибири формально относятся к одной категории, но требуют совершенно разных атрибутов для описания. У квартиры важны этаж, количество комнат и тип ремонта. У земельного участка — площадь, назначение земли и наличие коммуникаций.

Всю эту сложную иерархию знаний хранит сервис под названием «Инфомодель». Это своего рода «энциклопедия» Авито, где прописано, какие детали нужны для объявления из каждой категории, какие из них обязательные и какого типа данные они должны содержать.

После определения категории в игру вступает другая модель.

Система под названием «Конструктор подачи» будет динамически взаимодействовать с пользователем и адаптировать интерфейс работы с объявлением под специфику товара. Для автомобиля она запросит VIN-номер и предложит загрузить данные о модели, годе выпуска и объеме двигателя. Для одежды — выбрать размер и указать состав ткани.

Кроме того, эта система способна анализировать загруженные фото, предлагая заполнить за пользователя название и категорию товара. Для подержанного ноутбука она напомнит указать наличие неисправностей и состояние батареи. Для квартиры — упомянуть про ремонт и вид из окна. Это не просто заготовки — собственная большая языковая модель A-Vibe «на ходу» создает объявление в зависимости от специфики товара. Пользователю достаточно скорректировать его и добавить отдельные уникальные характеристики. А другой алгоритм — IMV (Instant Market Value) — на основе данных платформы подсказывает покупателю, какая цена будет справедливая и поможет быстрее продать товар.

-2

К концу этого этапа из набора фотографий и текстовых набросков пользователя рождается полноценное структурированное объявление. Каждое поле заполнено, категория определена точно, описание товара составлено. Объявление готово отправиться дальше — на проверку безопасности.

Валидация и верификация: как проверяют товар и продавца

После того как пользователь заполнил все поля и нажал «Опубликовать», объявление не сразу попадает на платформу. Сначала оно должно пройти первичную проверку на корректность. Задача этого этапа — автоматически проверить объявление на ошибки и убедиться, что оно соответствует базовым правилам сервиса. Система должна убедиться не только в технической корректности данных, но и в надежности продавца.

Эти задачи выполняет предобученный автоматический сервис валидации. Он обрабатывает параметры объявления по спецификациям инфомодели. Система проверяет:

  • заполнены ли все обязательные поля (заголовок, описание, цена);
  • соответствуют ли введенные значения установленным правилам (например, цена должна быть положительным числом, текст описания не может быть слишком коротким);
  • корректны ли форматы введенных данных (телефон, email);
  • логична ли информация (год выпуска автомобиля не может быть из будущего).

Если модель видит пропуски в необходимых полях или некорректные данные, она не пропустит объявление дальше и предложит пользователю исправить неточности.

Следующий этап после проверки объявления на корректность — верификация личности продавца. В частности, Авито пользуется верификацией через банковские сервисы: пользователь может получить значок «Документы проверены», пройдя авторизацию через свой банк. За несколько минут система отправит запрос в банк и, получив подтверждение, присвоит значок. Такая верификация значительно увеличивает доверие пользователей к продавцу и, как следствие, количество просмотров его объявления.

После того как объявление было проверено на корректность и соответствие всем требованиям платформы, оно отправляется дальше.

Модерация: еще один фильтр безопасности

Это, пожалуй, самый высокотехнологичный этап в жизни объявления. Здесь работает целый набор ML-моделей, которые выявляют недобросовестные объявления, спам и опасный контент.

Алгоритмы проверяют содержимое объявлений на соответствие правилам площадки и законодательству. Авито использует автоматическую модерацию — систему на основе машинного обучения, которая сканирует весь контент в объявлении. Если обнаруживаются незначительные нарушения (например, название товара написано заглавными буквами или на фотографии есть контактный номер продавца), они могут быть исправлены автоматически. Серьезные нарушения приводят к блокировке объявления и даже блокировке аккаунта в критичных случаях.

Модерацию осуществляют несколько ML-моделей разного уровня сложности. Первая из них основана на технологии естественной обработки языка (англ. natural language processing, NLP), начиная от классических TF-IDF (оценка важности слова по его частотности) с логистической регрессией, заканчивая трансформерами и LLM. Такие модели не просто ищут запрещенный контент — они способны понимать контекст и распознавать семантику текста, состав изображения или видео. Они могут выявлять завуалированные предложения запрещенных товаров и скрытую рекламу. Языковая модель обучена на миллионах примеров объявлений, не соответствующих внутренним правилам Авито, и с высокой точностью определяет подобные паттерны, даже если они маскируются под обычный текст.

Следующий этап проверки — анализ прикрепленных изображений. За это отвечают модели компьютерного зрения, которые анализируют содержимое изображений. Например, классификационные модели на основе сверточных сетей и более новые визуальные трансформеры, а также различные архитектуры детекторов объектов.

Современные модели computer vision способны определять, что содержит изображение (и, как следствие, еще раз проверять соответствие фотографии текстовому описанию), находить на изображениях отдельные элементы (например, запрещенные товары) и распознавать типовые черты, говорящие о том, что фотография поддельная.

Все упомянутые ML-системы маркируют подозрительные объявления и передают их на дальнейший анализ. Его осуществляет так называемый модуль оркестрации, который принимает решения в соответствии с метками, которые внесли предыдущие сервисы: именно он решает, опубликовать объявление, отклонить его или отправить на ручную проверку. Для подозрительных объявлений, которые не были отклонены, но были размечены как таковые, в работу включаются модераторы — сотрудники Авито, которые проводят ручную проверку и принимают решение по спорным кейсам.

С помощью автоматической модерации Авито проверяет до 25 миллионов объявлений в день, даже если в них был изменен всего один символ. Автоматическая проверка объявления занимает от 60 до 90 секунд в зависимости от сложности, а ручная — от двух до 24 часов. После успешного прохождения модерации объявление наконец готово встретиться со своей аудиторией. Оно отправляется в поисковую систему Авито — центральную систему платформы.

-3

В лабиринтах поисковой машины

Попадание в поисковую систему — это момент, когда объявление начинает свою публичную жизнь. То, как именно оно будет показываться пользователям, зависит от различных алгоритмов ранжирования, обрабатывающих сотни сигналов для каждого поискового запроса.

Движок Авито построен на базе полнотекстовой поисковой системы Sphinx, которую отличает очень высокая скорость индексации. Но есть и векторный поиск — когда алгоритмы подбирают объявления по смыслу и контексту запроса, а не только по совпадению формулировок. На этом фундаменте выстроена многоуровневая архитектура с ML-ранжированием, персонализацией и десятками оптимизаций.

Когда объявление проходит модерацию, оно отправляется в очередь индексации. В течение нескольких минут данные обрабатываются и добавляются в поисковый индекс.

Когда пользователь вводит поисковый запрос, система последовательно сужает количество кандидатных объявлений, чтобы отобрать из них наиболее релевантные. Сначала полнотекстовый поиск и базовые фильтры отбирают до ста тысяч потенциально релевантных объявлений. Далее два уровня ранжирования выбирают из них самые подходящие. Первый рассчитывает релевантность объявления и вероятность заключения сделки между продавцом и покупателем. После этого этапа остается около пятисот объявлений. Следующий этап ранжирования более тонкий и максимально персонализированный. Его задача — оставить около пятидесяти наиболее подходящих объявлений на основе более сложных признаков. В результате пользователь видит от тридцати до пятидесяти объявлений, максимально удовлетворяющих его поисковому запросу.

Как работают рекомендации

В 2024 году платформа перешла от эвристической системы к машинному обучению на базе трансформерной модели, которая анализирует миллиарды пользовательских действий и обрабатывает до 200 000 запросов в минуту. Для продавцов это означает непростую реальность: алгоритм больше не ранжирует объявления по набору статических признаков. Он в реальном времени решает, какое объявление логично показать конкретному человеку именно сейчас.

Вместо подсчета просмотров и кликов модель анализирует последовательности действий пользователя как временной ряд. Причем действия имеют разный «вес»: обычный просмотр, добавление в избранное и контакт с продавцом — принципиально разные сигналы для системы. Более того, учитывается источник действия: объявление, найденное через поиск, интерпретируется иначе, чем то, по которому кликнули из рекомендаций. Поэтому отдельные объявления могут терять показы не из-за текста или цены, а потому что алгоритм распознал завершенный сценарий — например, покупку — и перестал «разогревать» пользователя этой категорией.

Система умеет подстраиваться под разные сценарии покупки. В одних категориях человек может выбирать неделями — как с автомобилями или недвижимостью. В других решение принимается почти мгновенно, как в услугах.

Технически модель предсказывает не товар, а следующее вероятное действие пользователя — по аналогии с тем, как языковые модели предсказывают следующий токен в тексте. Система теперь гораздо лучше понимает, когда интерес зарождается, на пике или уже исчерпан. И если раньше можно было «дожимать» показы за счет ключевых слов и описаний, то теперь объявления конкурируют не друг с другом напрямую, а за право стать логичным следующим шагом в поведении конкретного человека.

Эффект от этого измеряют контактом с продавцом. В Авито для этого используют метрику Daily Target Buyers: это число уникальных пользователей, которые за день реально выходят на связь: нажимают «показать телефон» или пишут сообщение. Эта метрика очень инерционная: на платформе с десятками миллионов пользователей сдвинуть ее даже на доли процента крайне сложно. Поэтому любой устойчивый рост DTB не косметическое улучшение, а признак того, что система действительно стала лучше попадать в момент, когда пользователь готов к действию.

Монетизация: как объявление продвигают

После создания объявления продавец выбирает формат публикации — бесплатный или платный. Это отдельная механика. Уже после публикации он может дополнительно увеличить видимость объявления, подключив продвижение — по сути, прорекламировав его в поиске.

Для этого доступны разные инструменты: услуги ×2, ×3 и другие форматы усиления показов, выделение цены цветом, а также увеличение карточки объявления в поиске (XL-объявление), которое делает его заметнее для пользователей.

Для профессиональных продавцов предусмотрены инструменты управления продвижением: они позволяют задавать бюджет и цену просмотра. Сервис распределяет показы объявления в поиске, ориентируясь именно на эту цену просмотра и выбранные настройки.

Отдельные продуктовые фичи помогают автоматически управлять показами и расходом бюджета — например, автоматическая настройка цены просмотра, которая подбирает оптимальный уровень расходов без ручной корректировки.

В результате объявление получает релевантные показы в поиске и видимость для потенциальных покупателей. Когда происходит совпадение интересов, пользователь пишет продавцу, и начинается их прямое общение.

-4

От клика к сделке

Когда покупатель находит интересующее объявление и решает связаться с продавцом, включаются механизмы защищенной коммуникации. Это критически важный этап, где технологии должны обеспечить баланс между удобством общения и защитой пользователя.

Основной канал связи между покупателем и продавцом — встроенный чат Авито. Это не просто мессенджер, а комплексная система с множеством уровней защиты. Все сообщения в переписке проходят через системы антиспама и антифрода в реальном времени. ML-модели анализируют каждое сообщение на предмет нечестных паттернов, фишинговых ссылок и попыток увести общение за пределы платформы.

Если раньше для этой задачи использовались регулярные выражения — способ поиска заранее определенных выражений и словоформ в тексте, — то сейчас за это отвечает новая NLP-модель. Она обучена на миллионах примеров недобросовестной переписки. Система понимает контекст диалога и может определить момент, когда разговор о товаре переходит в попытку мошенничества. Например, если продавец внезапно просит перевести предоплату на карту или предлагает произвести оплату через подозрительный сервис.

При обнаружении подозрительного контента пользователь получает предупреждение прямо в интерфейсе чата. Это не блокировка общения, а именно предупреждение: финальное решение остается за человеком. Такой подход позволяет защитить пользователей, не обрывая при этом их общение.

Все сообщения хранятся в зашифрованном виде с использованием современных криптографических алгоритмов. Переписка пользователей не может быть прочитана третьими лицами, так как чаты защищены сквозным шифрованием.

Для защиты контактных данных пользователей используется технология проксирования телефонных номеров. Когда пользователь хочет позвонить продавцу, то он видит не реальный номер продавца, а виртуальный номер Авито. При звонке на этот номер вызов автоматически переадресовывается на его настоящий телефон. Это позволяет сторонам связаться напрямую, но при этом защищает их реальные номера от утечки.

Когда стороны договариваются о сделке, то они переходят к следующему этапу — оплате товара и оформлению доставки.

-5

Карты принимаете?

Кульминация жизненного пути объявления — момент, когда покупатель и продавец договорились о сделке. После ее заключения должна произойти оплата товара. Для этого используется сервис «Безопасная сделка» — технологическое решение, которое защищает обе стороны от рисков.

Покупатель переводит деньги не напрямую продавцу, а на специальный счет Авито. Деньги замораживаются там до момента, пока покупатель не подтвердит получение товара, проверив его качество. Только после этого средства переводятся продавцу.

За этой простой идеей стоит сложная финтех-инфраструктура, интегрированная с различными банками и системами доставки. В ее зону ответственности также входит защита персональных данных пользователя во время оплаты и координация различных систем безопасности, которые отвечают за анализ транзакции на предмет неправомерных действий как со стороны продавца, так и со стороны покупателя.

Продавец создал и разместил объявление, покупатель нашел его и совершил покупку. После получения заказа покупатель может оставить отзыв о продавце — простое действие, но и за ним скрываются различные технологические процессы.

Было приятно иметь с вами дело

Отзыв, который покупатель оставляет на странице продавца, необходим не только другим покупателям, принимающим решение о том, связываться с ним или нет. Авито анализирует текст отзыва и на его основе формирует внутренний рейтинг продавца. Этот рейтинг — не просто цифра в профиле пользователя. На его основе будут скорректированы рекомендательные алгоритмы, что поможет в продвижении объявлений добросовестных продавцов и даст возможность отсеять тех, с кем у покупателей возникли серьезные проблемы.

Продавец со своей стороны получает доступ к статистике продаж, которая помогает ему эффективнее планировать следующие шаги и выбирать оптимальные стратегии размещения и продвижения объявлений.

-6

Эволюция классифайдов

Путь от нажатия кнопки «Разместить объявление» до его публикации занимает у пользователя несколько минут активных действий. За это время объявление обрабатывается десятками микросервисов, анализируется множеством ML-моделей, проверяется системами безопасности, индексируется поисковыми алгоритмами и ранжируется персонализированными механизмами выдачи. Каждый этап — это отдельная технологическая система со своей архитектурой, нетривиальными математическими решениями и командой разработчиков за плечами.

Каждый день через эту систему проходят миллионы объявлений — от детских колясок до квартир, от подержанных учебников до раритетных автомобилей. И хотя для пользователя весь процесс выглядит как простая последовательность кликов, за кулисами стоит сложнейший технологический пайплайн.

В этом, пожалуй, и заключается главная особенность современных технологий: чем проще выглядит интерфейс, тем сложнее механизмы, которые его обеспечивают.

Чтобы больше узнать о команде AvitoTech и задачах, которые решают инженеры, переходите на сайт.

Реклама: Реклама ООО «Авито Тех», ИНН 9710089440. Erid: 2W5zFGCMwAp