Найти тему
Дзенофоб

Нейросеть Кэт от Яндекса

Дмитрий Туманов
Дмитрий Туманов

В предыдущей части я попытался объяснить, почему тематические теги обычно проставляются на автомате, а не вручную. Во второй же части я попробую познакомить вас с нейросетью Дзена, это поможет понять, что никакой ИИ не сканирует текст ваших публикаций, а лишь оперирует уже проставленными тематическими тегами. Возможно, будет сложновато для понимания. Но ряд комментаторов канала “Дзенофоб” сами напросились на жесть.

Дзеноводы то и дело подчёркивают, что в основе Яндекс. Дзена лежат механики искусственного интеллекта – глубинное машинное обучение. А именно надстройка для Матрикснета – CatBoost (подогнали с основного детища Яндекса – поисковика), разработанная командой спецотдела под руководством талантливой и симпотишной девушки Анны Вероники-Дорогуш (всем скептикам напоминаю, что первым в истории программистом была женщина!). “Мы уже опробовали CatBoost в сервисах Яндекса. В Дзене его задействовали для ранжирования ленты рекомендаций” (сайт компании Яндекс). Никакой Альфы Центавры и прочих Туманностей Андромеды предметно нет. Это просто игра словами. Сегодня мы так назовём котёнка, а завтра как-то иначе.

При этом дзеноводы постоянно умалчивают, что нейросеть Кэт в Дзене применяется не везде. Да, Лента рекомендательного контента действительно формируется её нежными и, конечно, озорными ручками.

-2

Ранжирование публикаций на основе поведенческих факторов со стороны пользователей Яндекс. Дзена (что выдавать чаще и выше в Ленте). Определение охвата для ваших публикаций (1000 или 10 000 показов вам дать). Автоподборка тематически близких публикаций с других каналов к вам в персонифицированную Ленту (а именно такой она, так или иначе, получается). Это всё к ней. Она – девочка умная. Хорошо отслеживает пользовательскую активность в рамках Дзена. Она вас помнит. Знает, что вас привлекло, что вас заинтересовало. Старается вам угодить. И даже предвосхитить событие. Подсунуть вам что-то новенькое, что вас бы могло потенциально увлечь.

Обычно нейросети создаются на языках логического программирования типа Пролога (Prolog) или универсальных языках общего пользования – вроде Питона (Python). Системы искусственного интеллекта работают с базами знаний. Ориентированы на поиск решения задачи в условиях недостатка информации (неполноты входных данных). Они обучаемы (лишь бы тестовый материал для натаскивания нейросети бы подобран корректно и правильно структурирован), в том числе самообучаемы. Оперируют целостным представлением объекта, могут выявлять характерные качества его образа. Способны делать семантический анализ текста, то есть определять его смысловое содержание, а ещё стилистическую уникальность и даже выдержанность текста в какой-либо эмоциональной тональности.

У нейросети Кэт есть безымянный братишка – о нём дзеноводы предпочитают не говорить. Видимо, он был нежелательным, но вынужденным ребёнком. Именно он проставляет тематические теги у публикаций, которые потом уходят в Ленту выдачи Дзена. О нём в третьей – заключительной серии.

Продолжение следует…

Автор: Дмитрий Туманов