768 подписчиков

Сществуют ли волшебные системы аналитики для маркетплейсов?

22 октября 202422 окт 2024

6 мин

Однажды по дороге в детский сад мой папа объяснил мне устройство ядерного реактора. И я всё поняла. Примерно такого же уровня задача сегодня передо мной. Попробую справиться. Поехали. Буду объяснять, что такое предиктивная аналитика. И есть ли такие системы для маркетплейсов, которые могут на основе искусственного интеллекта подсказать, какие изменения нужно внести, чтобы пошли продажи. Самое простое - объяснить слово "предиктивная". Это предсказание, что будет в будущем на основании предыдущих данных. Еще в 90-х годах я получала диплом именно по такой специальности. Сейчас это называлось бы искусственным интеллектом. То есть математический аппарат систем прогнозирования и моделирования активно развивается не менее 30 лет, и именно его используют все нейросети. Нет никаких особо секретных формул и методик, дьявол в деталях. При этом Россия особенно в прошлые годы была в прогнозировании на переднем крае науки. Все системы аналитики можно разделить: ✔️ Системы поддержки принятия решений.

Буду объяснять, что такое предиктивная аналитика. И есть ли такие системы для маркетплейсов, которые могут на основе искусственного интеллекта подсказать, какие изменения нужно внести, чтобы пошли продажи.

Самое простое - объяснить слово "предиктивная". Это предсказание, что будет в будущем на основании предыдущих данных.

Еще в 90-х годах я получала диплом именно по такой специальности. Сейчас это называлось бы искусственным интеллектом. То есть математический аппарат систем прогнозирования и моделирования активно развивается не менее 30 лет, и именно его используют все нейросети. Нет никаких особо секретных формул и методик, дьявол в деталях. При этом Россия особенно в прошлые годы была в прогнозировании на переднем крае науки.

Все системы аналитики можно разделить:

✔️ Системы поддержки принятия решений. Это, например, BI системы - когда обрабатывается огромный массив данных и на дашборды выводятся ключевые вычисленные показатели в реальном времени. Но уже человек принимает решение, что с этим делать.

Это также большинство отчетов аналитики, например, MPStats и других систем, когда вы видите обработанные данные, но не готовое решение, что с этим делать.

✔️ Системы принятия решений. Когда вам выдается уже готовое решение. Например, ChatGpt на запрос выдает одно готовое решение, которое считает наиболее подходящим.

Или, например, навигатор строит вам лучший (не всегда) маршрут - тоже выдается 1 готовое решение.

Нам бы всем хотелось, чтобы машина подсказывала нам правильные решения. Например, в шахматах это прекрасно работает, и компьютер обыгрывает гроссмейстеров.

Почему в бизнесе такие системы до сих пор не широко не используются?

Здесь мы переходим к страшной картинке, которую я прикрепила к посту для отпугивания злых духов. Это самый простой вариант написания формулы, без которой нам не обойтись - показывает величину возможного отклонения от прогнозного значения.

🦉Например, система дает нам прогнозное значение 50, но вообще с вероятностью 95% значения могут быть в интервале от 0 до 100. То есть отклонение - 50. Мы узнали, что вероятность встретить динозавра 50% - или встретишь, или не встретишь.

Всё дело в том, что давая нам конкретную рекомендацию, система выбирает из большого множества вариантов. И точность рекомендации зависит от:

✅ Количество предыдущих данных, на основании которых мы делаем вывод. Это буква n в формуле. Чем больше данных, тем более достоверным будет наш прогноз.

🦉Допустим, мы встретили на улице 3-х мужчин роста 175 см, 180 см, 178 см. И основании этого решили, что мужчины не могут быть выше 180 см. Количество данных 3 - слишком мало, чтобы сделать адекватный вывод.

Малое количество данных - наверно самая частая причина неверных аналитических выводов. Мы протестировали CTR на 1000 показов и сделали вывод, а на 10 000 показов получили диаметрально противоположные значения. Кто-то придумал гипотезу, как составить наименование для SEO - и на 3 карточках были хорошие результаты. Но это вообще не означает, что гипотеза рабочая.

Когда говорят, что нейросеть обучается, в первую очередь имеется в виду, что в нее загружается огромный объем данных.

✅ Разброс самих данных (дисперсия). Чем сильнее могут варьироваться данные - тем сложнее сделать прогноз. Эта часть с буквами Х в формуле. Если отклонения от среднего большие - нужно намного больше данных.

🦉Никакой Гидрометцентр не скажет, какой примерно будет температура 1 мая 2025 года в Москве. Хотя есть многолетняя история наблюдений. Температура будет примерно в интервале от 0 до +30 градусов, в последние годы бывали любые варианты из этого интервала.

Чаще всего причина большого разброса данных - во влиянии внешних факторов. И вроде бы задача сводится к тому, чтобы найти, какие внешние факторы влияют, насколько сильно (найти коэффициенты) и составить формулу.

Возникает слово корреляция. Мы можем статистически узнать, есть ли зависимость между двумя факторами. А если есть - ура, включаем фактор в формулу.

В корреляции снова 2 вещи, которые спутают все карты:

✔️ Снова нужно много данных, если мало - можно забыть о достоверности.

✔️ Корреляция может быть, и даже очень высокой. Но на деле оба фактора зависят от какого-то третьего. А скорее всего - от микса взаимосвязанных факторов. Ещё можно перепутать причину и следствие.

🦉Пример. 2 фактора - 1. Девушки стали надевать легкие платья, 2. Выросли продажи мороженого. Корреляция очень высокая. Значит можно сделать вывод, что для роста продаж мороженого достаточно одеть девушек в летние платья. На самом деле оба фактора зависят от третьего - температуры воздуха.

Поэтому большие нейросети дополнительно обучают на людях. Показывают людям результаты, а они говорят - верно или нет. Потому что машина настроила модели, которые могут не иметь никакого отношения к реальности. Без этого этапа обучения нейросети выдают полную ерунду.

К чему были все эти сложные объяснения?

К тому, что система предиктивной аналитики, чтобы ей можно было как-то верить, должна:

1️. Базироваться на огромном объеме данных. Причем достоверных.

2️. Данные должны быть однородными, без больших отклонений. Любой сбой маркетплейса - и вот у нас большие отклонения в данных. Любое нововведение - аналогично. Изменили алгоритм - все прошлые данные потеряли свою ценность.

3️. Математические модели должны быть обучены и протестированы на очень большом количестве реальных людей/бизнесов.

Поэтому системы предиктивной аналитики, конечно, существуют. Владельцами хороших систем являются сами маркетплейсы. Потому что:

1️. Обладают максимальным объемом достоверных собственных данных (а не полученных через какие-то внешние сервисы).

2️. Владеют сведениями о большинстве внешних факторов, потому что являются их авторами. Маркетплейсы знают свои алгоритмы, а не строят об этом догадки.

3️. Обладают большими ресурсами - программистами, математиками, серверами и пр.

4️. Могут тестировать свои системы на большом количестве реальных людей.

И даже в этих идеальных условиях ВБ только подступается к персонализации и генерации с помощью ИИ. На деле ничего нормально не работает.

Что касается автоматических рекомендаций по карточкам, то здесь вообще нет необходимых данных, не существует в природе.

⚡️Теперь возьмем внешнюю систему. Например, компанию JVO.

Компания обещает, что они анализируют данные маркетплейсов, в том числе конкурентов. И на основании этого говорят вам, что конкретно нужно изменить в карточке и в SEO, чтобы увеличились продажи.

При этом компания существует всего год, в штате 5 человек. Судя по отчетности, мощных вычислительных ресурсов у нее нет.

Из всего, что я написала выше, несложно сделать вывод, что использовать такую систему неплохо. Но как дашборд с данными для принятия решений - такой функционал у них есть. Если бы система не давала конкретных рекомендаций, а показывала каким-то образом набор вариантов с вероятностями, а еще лучше - саму формулу с внешними факторами - тоже можно было бы использовать её в дело.

Но компания сама нам отвечает на все вопросы. Потому что на сайте сначала пишет: оборот наших клиентов увеличивается на 68,7% в первый месяц. А потом чуть ниже приводит кейсы (по идее самые выдающиеся результаты), где рост продаж за весь период использования - 40%, 50%. Я бы не отдала ни 1 рубля сервису с таким гибким подходом к достоверности данных.

Какой вывод? Пока в условиях неопределенности придется использовать самую совершенную нейросеть - человеческий мозг. Но желательно данные для мозга максимально обработать (структурировать, сгруппировать, посчитать показатели и пр.). Для этого использовать проверенную и удобную лично для вас аналитическую систему.

Для регулярных операционных задач, у которых есть правила и алгоритмы - без аналитических систем никуда. Те же логистические задачи, unit-экономика. Но для хороших карточек - пока только голова.

Больше полезных материалов о карточках, конверсии, SEO, воронках на маркетплейсах читайте в Телеграм канале 20 тысяч часов Екома .

Бизнес и финансы

1,13 млн интересуются