Найти в Дзене
Лошадь кузьмича

Предиктивный движок "Ванга"

Всегда думал, что Биг Дата это заумная непонятная штука пока не столкнулся с ней сам. Ниже мой опыт и на сколько я понял, что ж это за зверь такой. Сайт с высокой пользовательской посещаемостью так или иначе хранит информацию о зарегистрированных и незарегестрированных пользователях. Какую инфу хранит и использует сайт? Всю! Все, что вы указываете у себя в профиле! Пол, возраст, увлечения, посещаемые места, с кем вы в отношениях, какие книги читаете, какие песни слушаете итд итп Вот вся эта информация называется Массив данных. Использовать массив данных можно для разных целей, но чаще всего их юзают для анализа пользовательских сценариев на сайте, иными словами, мы знаем, что вы любите делать на том или ином сайте и сможем спрогнозировать ваши дальнейшие действия на сайте. В рамках нашего сайта (отсылка на дисклеймер Фарго) есть 1500 самых активных пользователей. Эти ребята создают достаточно интеллектуальный контент и в процентом соотношении фигачат 80% контента нашего ресурса. 20

Всегда думал, что Биг Дата это заумная непонятная штука пока не столкнулся с ней сам. Ниже мой опыт и на сколько я понял, что ж это за зверь такой.

Сайт с высокой пользовательской посещаемостью так или иначе хранит информацию о зарегистрированных и незарегестрированных пользователях. Какую инфу хранит и использует сайт? Всю! Все, что вы указываете у себя в профиле! Пол, возраст, увлечения, посещаемые места, с кем вы в отношениях, какие книги читаете, какие песни слушаете итд итп Вот вся эта информация называется Массив данных. Использовать массив данных можно для разных целей, но чаще всего их юзают для анализа пользовательских сценариев на сайте, иными словами, мы знаем, что вы любите делать на том или ином сайте и сможем спрогнозировать ваши дальнейшие действия на сайте.

В рамках нашего сайта (отсылка на дисклеймер Фарго) есть 1500 самых активных пользователей. Эти ребята создают достаточно интеллектуальный контент и в процентом соотношении фигачат 80% контента нашего ресурса. 20% контента приходится на 1 350 000 пользователей. Какая идея мне пришла в голову? Взять массив данных и проанализировать 1,5 к юзеров на взаимосвязи т.е. найти что-то, что по поведению объединяет этих спартанцев. Также, мы решили взять некоторые общие параметры из ГА. Прогнав спартанцев через параметры мы получили 3-4 устойчивые взаимосвязи, которые мы можем применять как к Raw Data (незарегистрированные пользователи по сути голая сессия) так и к зарегистрированной пользовательской мертвой базе. Если голая сессия по своим повадкам на сайте выполняет некоторые взаимосвязи, то мы выводим поп ап со спец предложением. Суть в том, что мы вроде как понимаем, что этот чувак может потенциально стать крутым контент мейкером в рамках нашего ресурса и понимаем, что его надо подтолкнуть к нужным действиям.

В общем, Вангу запилили ждем первых результатов. Как только мы открутим ее на достаточное количество сессий, поделюсь результатами.