Найти в Дзене
Дневник Таксиста

Приоритет и выручка (часть 3). Первые итоги по парковой статистике

Наконец то все необходимое собрано, структурировано, проанализировано и готов представить общественности первые результаты.
ДИСКЛЕЙМЕР: Признаться - результат немного разошелся с моими личными ожиданиями. И это, несмотря на достаточно долгий срок наблюдения и личный опыт. Однако в этом и есть сила статистики - она чужда когнитивным искажениям. Любой парк , который озадачится аналитикой -
Оглавление

Наконец то все необходимое собрано, структурировано, проанализировано и готов представить общественности первые результаты.

Когда оклейка пошла не по плану...
Когда оклейка пошла не по плану...

ДИСКЛЕЙМЕР: Признаться - результат немного разошелся с моими личными ожиданиями. И это, несмотря на достаточно долгий срок наблюдения и личный опыт. Однако в этом и есть сила статистики - она чужда когнитивным искажениям. Любой парк , который озадачится аналитикой - получит точно такие же данные (плюс минус) - независимо от того верит ли он в приоритет или нет. Статистике по барабану...

Итоги соц-опроса

Началось все с этого:

Но сначала - хочется прокомментировать итоги опроса - как считает народ, насколько приоритет влияет на заработок. На момент выхода статьи мнения разложились так:

-2

Когда я составлял опрос и закладывал ответы - тогда они казались мне вполне адекватными, но сейчас я понимаю, что варианты ответов нужно было делать более конкретными. И теперь, глядя на итоги - практически любой ответ можно назвать и правильным и неправильным. Слишком они субъективны. Но в целом - даже такие ответы интересны.

40% водителей считают что взаимосвязи нет. То есть не важно какой у тебя приоритет - заработок от этого никак не меняется. Тут все понятно и забегая вперед - могу сказать, что это наиболее далекий от полученных результатов (без обид)

А вот большинство - 42%, - оказались ближе. НО... тут как раз и всплывает пресловутая субъективность. 15% - это "почти незаметно" или "существенно" ? Для кого то, кто работает скажем по 3-4 часа в день, 15% в реальном денежном выражении - разница ну скажем так, вполне может "размываться и слиться" с колебаниями заработка под влиянием других причин.

И лишь незначительные 16% выбрали "влияет существенно" (что на мой взгляд - отнюдь не попадает в точку, но самое близкое - ЕСЛИ УЧИТЫВАТЬ что речь идет о постоянниках, а не подработчиках)

Но... это всего лишь наши ощущения, наша точка зрения к определенным фактам, который каждый рассматривает под своим углом зрения, соизмеряясь со своим личным опытом и обстоятельствами.

Насколько этим цифрам можно доверять? (раздел для сомневающихся)

Самый первый вопрос который мне скорее всего зададут - а насколько эти цифры отражают реальную действительность? И поверьте, прежде чем затеивать всю эту кашу - я еще раз освежил свои давние познания в статистике и заранее подсуетился чтобы получить нужные данные для расчета репрезентативности моих дальнейших изысканий:

Таким образом я получил генеральную совокупность, и уже далее по формулам не составило труда подобрать необходимую количественную выборку с учетом специфики водителей (постоянники-подработчики, время на линии, активные часы, исключение из выборки эм... скажем так "багоюзеров" с их "выдающимися" результатами, Супер-водителей на К+ включающих все подряд, включая эконом и доставку, гуляющих по разным машинам-тарифами, и т.д).

Другие нюансы я описывал здесь:

При составлении выборки я сознательно (во избежании черри-пикинга ) делал ее без учета приоритета, который просто подставил уже перед непосредственно анализом, когда выборка была сформирована)

Изначально я рассчитывал на выборку на уровень доверительность - 90% ( с погрешностью 5%), но из за вскрывшийся специфики хранения яндексом некоторых данных, пришлось в этом месяце (марте) ограничится 85% доверительности при тех же 5% погрешностях. Для первого раза - вполне достаточно.

О чем говорят эти понятия? О том, что полученные данные как минимум на 85% отражают реальное положение дел в городе Санкт-Петербурге (это важно).

В дальнейшем, когда я настрою процесс извлечения данных и аналитику - я постараюсь сделать подобные изыскания и по другим городам. (но там чуть сложнее - во первых сложнее добыть адекватную цифру количества водителей в день (генеральную совокупность) - в городе, ну и далеко не во всех городах у нас найдется необходимое количество водителей в нашем парке, чтобы данные были репрезентативны.

Но впрочем хватит болтовни - переходим к цифрам:

Приоритет все таки рулит... вопрос только куда? ))

Можете задавать любые вопросы по таблицы и почему именно так...
Можете задавать любые вопросы по таблицы и почему именно так...

Итак, по первому исследованию (март) - влияние приоритета ЗАМЕТНО. Насколько оно большое? Тут каждый думает по своему. Лично я теперь считаю что взаимосвязь между приоритетом и заработком в час однозначно существует - это доказывает не только статистика по каждому тарифу, но и тот факт, что верны предположения о возрастании влияния приоритета по мере увеличения тарифа. Если для эконома разница едва заметна - 6% это слишком близко к статистической погрешности в 5%, то дальше идет по нарастающей: комфорт - 12%, К+ - 18%. И только бизнес выбился с 15% (но тут я полагаю, что скорее всего влияние оказало общее "тухлое" время для Бизонов).

Так что да, те кто считает что для эконома приоритет до фонаря - можно сказать что почти прав ))))) (однако разброс по заработку в экономе весьма велик, и я бы даже сказал больше чем в других тарифах, просто при усреднении этого незаметно - и тут дело кое в чем другом)

Зеленые цифры показывают насколько больше СТАТИСТИЧЕСКИ (при прочих равных) в месяц при стандартном 8 часовом рабочем дне с 2 выходными может зарабатывать водитель в своем тарифе, если у него будет приоритет больше.

И вот тут уже вопрос перемещается в практическую плоскость. Допустим, у водителя сейчас маленький тариф - стоит ли его поднимать, чтобы зарабатывать больше? - я считаю что нет. Не настолько велика разница.

НО.... эти цифры могут помочь принять решение скажем арендникам. Например - стоит ли брать в аренду машину лучше классом и как можно более свежую (повышая приоритет)? Тут нужно считать. (математика в такси - наипервейшая наука)

И в целом хотелось бы отметить - что в рамках данного исследования ставится вопрос исключительно пока теоретического порядка - ВЛИЯЕТ ли приоритет или нет.

Предварительные данные - получены. Дальше я планирую еще сделать несколько месяцев, чтобы перепроверить данные и усреднить. Добавить еще города...

Бонусный вывод

Думаю, наблюдательные уже задались вопросом - зачем я разделил в комфорте и К+ на чистый и смешанный. На самом деле, когда я уже делал аналитику - я вспомнил про старые споры - что лучше, держать свой высокий тариф или разбавлять его тарифом пониже. У обоих вариантов есть свои обоснования. И я просто решил проверить так сказать на практике. И ничуть не удивился данным по своему родному К+ . В "голодный сезон" - когда заказов по своему тарифу явно не хватает чтобы работать без простоев - включение тарифа пониже - реальный путь к повышению заработка в тарифе К+.

Ну а с комфортом - это было неожиданно. Я всегда недолюбливал этот тариф - считал его каким то несуразным. Однако в данном исследовании он меня удивил. Мало того, что он обскакал К+ , так еще и чистый вышел более выгодным чем смешанный. Но что-то мне подсказывает, что это какая то мартовская аномалия.

Посмотрим на данные по апрелю.

P.S. Что-то тут все таки не то...

Скажет подозрительный читатель... И будет прав. И дело тут не в неправильности выборки, или неправильных цифрах, неправильных интерпритациях...

Вся проблематика исследования по приоритету заключается в том что мы исследуем ВИДИМЫЙ приоритет. Тот, который показывается в диспетчерской и который каждый водитель видит у себя в приложении.

мНо есть еще и внутренний приоритет, кототрый яндекс учитывает так же по каждому водителю. А в алгоритме раздачи заказов считается СКОРИНГОВЫЙ балл водителя, который в свою очередь состоит из множества составляющих. Видимый приоритет - это только часть этого скорингового балла. Во внутреннем приоритете яндекса - учитываются другие параметры водителя - пресловутое соотношение предложенных заказов к выполненным, манера езды водителя, количество нарушений "стандартов яндекса", нарушений ПДД (привет службе мониторинга), количество и качество жалоб пассажиров (впрочем как и комплиментов , готовность к поездкам в определенные зоны - и это только фиксированные параметры. Так же учитываются и переменные факторы - количество часов на линии и близость к точке "дом", включенные пониженные тарифы, и тьма других параметров, мне пока неизвестных... Некоторые инсайдеры весьма туманно давали понять, что внутренний рейтинг намного больше видимого. Который, как верно предполагают многие - выполняет функции "морковки" перед мордой ослика...

Означает ли это, что видимый приоритет не влияет? Отнюдь нет. Просто это вершина айсберга. Действительность куда как сложнее... И предвосхищая следующую статью - я скажу, что анализируя данные для этой статьи - я собрал в несколько раз больше информации чем было необходимо - практически всю доступную мне. И в следующих материалах я буду анализировать статистическое влияние других различных факторов на заработок. (ведь даже скажем при большом приоритете - разница в заработке весьма существенна у разных людей - и тут не паханное поле для анализа )))))

В общем, - не переключайтесь, подписывайтесь и задавайте вопросы ))