Найти тему
Технопарк

Pinterest об ИИ и системах таксономии, лежащих в основе трендов (часть 2)

Оглавление

Продолжим изучать нововведения сети Pinterest!

(Первая часть)

Картирование пользователей и запросов

Полезность таксономии не ограничивается отслеживанием трендовых тем. По сути, система под названием User2Interest (U2I) использует ее для отображения пользователей в соответствии с их интересами. Pins, с которыми взаимодействуют люди, и соответствующие Pins'овские метки интереса, которые генерируются P2I, служат сигналами, которые информируют U2I о прогнозах в адресной рекламе, органических рекомендациях и ориентированном на пользователя взгляде на таксономию. Например, он может вычислять статистические данные, такие как количество пользователей на узле таксономии, чтобы информировать рекламодателей о сдвигах в общем интересе.

Другая система - Query2Interest - отвечает за отображение коротких текстовых запросов к узлам таксономии. Ее сигналом является Pintext, многозадачная модель встраивания текста, которая выявляет сходство между коротким текстом и узлами таксономии, группируя запросы со схожими категориями и значениями для узлов. Q2I находится в производстве на различных рекламных площадках и органических поверхностях, говорит Pinterest, главным образом, для лучшего понимания намерений пользователей.

https://www.pinterest.ru/pin/453034043766240431/
https://www.pinterest.ru/pin/453034043766240431/

Создание и поддержание таксономии

Очевидно, что таксономия интересов играет жизненно важную роль в согласовании пользователей с контентом, который им, скорее всего, понравится. Но как это курируется? Согласно Cui и Shrouty, это многоступенчатый процесс, включающий в себя то, что называется фреймворком описания ресурсов (RDF), использование открытой онтологической среды WebProtégé и инженерный рабочий процесс, облегчающий обновление.

RDF используется для создания графиков (состоящих из узлов и краев, которые соединяются с узлами), в то время как WebProtégé создает визуализации, обе из которых помогают команде людей, на которых возложена задача проверки таксономии. Что касается вышеупомянутого инженерного процесса, то он видит, как ученые "Пинтереста" берут графики RDF в формате XML и создают таблицы реляционной базы данных для последующего использования.

Для каждой итерации таксономии, Cui и Shrouty и команда разрабатывают и расширяют таксономию, разработанную в ходе предыдущей итерации. При создании новых версий такие операции, как добавление нового узла, переименование существующего узла, удаление узла и слияние двух или более узлов выполняются с помощью эвристических правил.

Добавление в таксономию

Прежде чем добавить новую тему в таксономию, команда контент-инженера сначала рассылает условия кандидата в свой контент, юридический и другие отделы для рассмотрения. Затем, используя систему ИИ под названием "Нейронная таксономия расширения (NTE)" - которая используется в производстве для проектов по расширению таксономии в рамках Pinterest - прогнозируются вероятности существующего узла, а также условия кандидата-родителя. Прогнозируемые родители проверяются вручную для обеспечения высокого качества таксономии, после чего узлы добавляются в текущую таксономию в WebProtégé таксономами.

В дальнейшей работе Cui, Shrouty и коллеги намерены работать над построением новых типов отношений между субъектами в автоматическом режиме в таксономии и атрибутах ассоциированных субъектов. "Продвигаясь вперед, мы с нетерпением ждем дальнейшего развития того, как мы фиксируем и понимаем тенденции более своевременным и систематическим образом", - написали они.

Pinterest использует машинное обучение во всем своем бизнесе - не только в таксономических целях. В октябре прошлого года компания показала, что с помощью ИИ, который идентифицирует и скрывает контент, отображающий, рационализирующий или поощряющий самобичевание, удалось добиться 88%-ного сокращения количества сообщений о таком контенте. Lens, инструмент визуального поиска в режиме онлайн/оффлайн от Pinterest AI, который идентифицирует вещи, захваченные с помощью Pins или смартфона, и предлагает связанные с ними темы и продукты, теперь может распознать 2,5 миллиарда предметов домашнего обихода и моды. А уже в 2015 году Pinterest начал использовать ИИ для поверхностного сканирования связанных с ними Pins, или Pins по касательной к тем, которые визуально находятся над ними в сети и на мобильном телефоне.