Обращаете ли вы внимание на продвинутую статистику?
Сам я не то чтобы одержимый её фанат, но для любителей поковыряться в цифрах изучение неочевидных показателей занятие весьма увлекательное и полезное. Их внимательный анализ может помочь подобрать ключи к объяснению некоторых непонятных ситуаций и спрогнозировать дальнейшее развитие событий.
Поясню на примере. Начало славного пути в НХЛ российской суперзвезды Никиты Гусева откровенно не задалось. Игрового времени получал мало, баллы за результативность гроздьями не собирал, стабильными партнёрами по тройке не разжился.
Уже даже начала вызревать параллель с не задавшейся за океаном карьерой его недавнего партнёра по СКА и сборной России Вадима Шипачёва…
И тут появилась интересная цифровая выкладка по состоянию на конец октября), на которую обратил внимание:
Nikita Guev’s 5-on-5 possession stats:
32.35 Corsi% (worst in the league)
27.54 scoring chances% (worst)
25.72% expected goals% (second worst)
20.69% high-danger chances% (fourth-worst)
Приведенные данные продвинутой статистики натолкнули на мысль посвятить нескольким производным одного интересного показателя из advanced stats предлагаемое ниже исследование.
Хотите глубоко вникайте в значения, хотите нет, главное, что на тот момент хороший парень и мастеровитый игрок Никита Гусев – один из худших в лиге по целому ряду показателей, на которые современные коучи во многом опираются при выдаче кредитов доверия. Отчего было расти игровому времени, если пресловутый % владения шайбой при нахождении на льду Никитоса не выдерживал критики?
Про Корси и Фенвики многое уже сказано, давайте плотнее присмотримся к показателю expected goals, обозначаемому как xG. Этот термин впервые внедрил в обиход некто Алан Райдер в уже далёком 2004 году, а в наши дни его активно используют не только хоккейные специалисты, но и футбольные (правда главный тренер сборной Норвегии Эгил Ольсен ещё в 90х годах нечто похожее моделировал). А ещё армия прогнозистов, которые в выстраивании своих линий ставок, зачастую, именно от этого показателя и отталкиваются.
Смысл идеи господина Райдера состоит в том, что изначально бросок броску рознь и он предлагает ввести такое понятие как «качество броска». Чем бросок опаснее, тем выше его качество, тем больше вероятность взятия ворот.
Не придумав ничего лучшего, целеустремлённый Алан Райдер уселся смотреть хайлайты сезона 2002/03. История умалчивает, сколько он убил на это времени, но на выходе упёртый аналитик получил базу данных из 62 531 бросков и 5 810 взятий ворот. А ещё идентифицировал 1 899 ребаундов. Для чего он это делал? А мало оказалось ему привычной публикуемой статистики – кто забил, в какой ситуации, на какой минуте… - захотелось узнать мужику расстояние до ворот, угол броска, способ его нанесения и прочие детали. Научный труд требовал детального подхода. Да и делать ему было нечего, по всей видимости. Как бы там ни было, а задумку свою он до конца довёл.
Обработав всю эту базу данных, Алан Райдер разделил полученную выборку на две группы (броски стандартные и нестандартные), выделив отдельно отклонения от обычных дистанционных бросков. Мерилом качества такого броска стал коэффициент их перехода в голы или вероятность поражения цели при определённых обстоятельствах. Чем больше вероятность гола, тем выше оценка качества броска. Вот какие нестандартные обстоятельства он выделил (взята выборка из 7 197 бросков):
· броски по пустым воротам (эмпти-неттеры) после смены вратаря на шестого полевого – это 100% опасности;
· в обозреваемом периоде было реализовано около четверти всех назначенных буллитов, соответственно, качество буллитного броска оценено в 25%;
· лонг шоты – броски с расстояния более 61 футов (ширина зоны на североамериканских площадках составляет 64 фута). Реализация таких бросков составила 0,6% (32 из 4979);
· броски-скрамблы (броски из кучи-малы?), которые нельзя квалифицировать как рикошет или эмпти-неттер. Усреднённое значение для различных игровых ситуаций (большинство, меньшинство, равные составы) сформировалось на уровне 21,2%;
· рикошеты или добивания. Броски из таких ситуаций превращались в голы в 36,4% случаев.
Что касается стандартных бросков, а их набралось 55 334, автор тоже решил углубиться в исследование, подойдя к их изучению под лупой по следующим параметрам:
1. Игровая ситуация;
2. Дистанция;
3. Тип броска;
4. Влияние
игровой ситуации на эффективность типа броска.
Игровая ситуация. Большой разницы в уровне опасности угроз в меньшинстве и в равных составах не обнаружилось. Броски в меньшинстве всего-то на 1% чаще в голы воплощаются, что объясняется в первую очередь тем, что усреднённо они на полтора фута ближе к неприятельским воротам совершаются. Вероятность гола в таких ситуациях оценивается в 7,9%. А вот в большинстве она вырастает до 12,2%, что объясняется в первую очередь розыгрышем шайбы до верного с выводом на бросок записного снайпера с убойной дистанции (точка Овечкина) или созданием комфортных условий для определённого типа броска (рассмотрим ниже).
Дистанция броска. Взглянем на такой вот немудрёный график:
Два очевидных вывода:
1. Дистанция имеет значение (чем дальше от ворот, тем ниже % реализации броска);
2. При броске с любой дистанции его конвертация в гол куда вероятнее в пауэр плее (в большинстве).
Тип броска. Сезон 2002/03 явил следующую картину:
Как видим, бросками с замахом и кистевыми игроки пользуются гораздо чаще, чем другими разновидностями своего боевого арсенала. Однако из этой таблички совершенно не следует, что всем надо стремиться во что бы то ни стало сломя голову кидаться подправлять траектории выстрелов партнёров по команде. Следующая диаграмма увязывает разновидности бросков с дистанцией, помогая проанализировать сравнительную частоту бросков с того или иного расстояния (мы помним, не дальше чем 61 фут). Показан удельный вес каждого вида броска в общем их вале:
До 35тифутового расстояния чаще используют кистевые броски, свыше – выстрелы а-ля Валера Каменский или Бретт Халл.
Это как бы вводные данные были, без них никак. Предлагаю перейти к эффективности. На помощь спешит следующий график. Я так понимаю, что 100% по вертикальной оси означают усреднённую эффективность всех бросков, а отклонения вверх или вниз – повышение или понижение вероятности поражения цели:
Для каждого типа бросков нарисована, так называемая, кривая точности. Разберём каждую. Заодно видеоматериалы приложу для наглядности.
- Подправления (tip-in).
Судя по диаграмме, самая опасная разновидность броска. Это и вышеприведенная табличка подтверждает, где средняя эффективность такого типа броска сформирована на уровне 20,3%. Чем дальше расстояние от ворот, тем вроде как опаснее становится. Но скорее всего в этих редких случаях (обычно ж в районе пятака такие возможности находятся) дальше шайба тоже меняет траекторию после немыслимых рикошетов. Но чётко видно, что на расстоянии до 25ти футов вероятность гола на 25-50% выше, чем для усреднённого броска.
- Броски с замахом (slap shots).
Пиковые значения эффективности находятся в диапазоне 35-45 футов. Тоже примерно на 25% опаснее становится при такого рода попытках.
- Кистевые (wrist shots).
С расстояния 35 футов и меньше именно этот тип броска становится доминантным (предыдущая диаграмма). Наблюдаем прямую зависимость эффективности от расстояния – чем оно меньше, тем шансы на взятие ворот выше.
- Бэкхэнды.
Тут ещё более ярко выраженная кривая. Понятно, бэкхэнды чаще всего в быстрых отрывах используют, при выходах один на один и подобного рода микродуэлях. С более дальних дистанций такие броски всё больше вынужденные и особых угроз не несут. В обычных для броска ситуациях вряд ли кому-то придёт в голову внезапно замочить бэкхэндом.
- Щелчки (snap shots).
Самая «ровная» кривая у них, наиболее опасны броски, наносимые с расстояния 15-20 футов – с такой дистанции вероятность гола совсем чуть-чуть уступает лишь подправлениям, остальные типы, в свою очередь, уступают щелкунам.
- Вертушка (wrap shots).
Используется в основном для попытки завести из-за ворот в ближний угол, в надежде, что вратарь не успеет переместиться. Самая редкая разновидность. Конечно же, наибольшие шансы поразить цель с минимального расстояния. И хотя диаграмма рисует принципиально иную зависимость, мне кажется, что просто-напросто количество таких вертушек на удалении от ворот можно по пальцам пересчитать и наносящим броски игрокам просто повезло, отсюда и рост к району средней появился. Но это чисто моё мнение, может всё не так.
Влияние игровой ситуации на эффективность типа броска. А вот не обнаружил эксперт никакой зависимости, как ни старался.
По большому счёту многое из этих выкладок и так понятно. Чем ближе дистанция от ворот, тем опаснее. Подправления траектории полёта шайбы - всегда угроза. Щелкать эффективнее с расстояния круга вбрасывания. И так далее.
Оставалось вывести на основании этих данных какую-то общую теорию, сгенерировать некий совокупный индекс, коэффициент, параметр... Так и придумался продвинутый показатель expected goals, который рассчитывается не иначе, как сумма голевых вероятностей для каждого броска в игре того или иного игрока или всей команды.
Если порассуждать, то пытливому болельщику могут пригодиться, как индивидуальный, так и командный показатель expected goals.
Индивидуальный призван порадовать многочисленную армию любителей фантазийного хоккея. Внимательно мониторя его, можно присмотреть исполнителя, которому вполне могут добавить игровое время или передвинут к более мастеровитым партнёрам, опираясь на стабильно высокий или стремительно растущий коэффициент. Не обязательно, что он при этом штампует голы. Главное, что создаёт возможности, атакуя с опасных дистанций. Не буду в глубину списка спускаться, приведу топ-15 на утро 21 января:
Как видим, тут всем нашлось место – и голеадорам, и распасовщикам, и защитникам, и форвардам. От этих игроков исходит максимум опасности. Есть и раскрученные суперзвёзды, но есть и совсем не очевидные персонажи, такие как Ши Теодор или Оскар Клефбом. Глядя на эту выкладку, понимаешь насколько важным винтиком в механизме Каролины был выбывший надолго из строя Дуги Хамильтон, полноценно заменить которого будет невозможно. Короче говоря, пищи для рассуждений эти цифры дают в избытке.
Изучение командного показателя xG наверняка является предметом пристального внимания любителей хоккейных ставок. На соотношении xGF и xGA (в том числе гостевой/домашний, равные составы/различные вариации большинства и меньшинства, овертаймовые выкладки…) построены многие прогнозные модели хоккейных аналитиков и экспертов. Например, обратил внимание на ежедневное мелькание в твиттере выкладок некоего Скотта Каллена. https://twitter.com/ByScottCullen Он как раз и опирается на комбинированный показатель xG в своих прогнозных раскладах по каждой предстоящей игре. Решил ради эксперимента и сам попробовать. Весь октябрь методично ставил на каждый матч по рублю, полагаясь исключительно на его мнение. Вот что из этого вышло:
Местами какие-то весьма отчаянные прогнозы прокатывали а-ля «Лос-Анджелес выиграет у Калгари». В целом пускай и не огромен перевес правильных предсказаний, но надо учитывать, что это начало сезона и цифры туда-сюда путешествовали. А в самом начале так и вовсе на основе прошлогодней статистики формировались. Честно говоря, октябрём и ограничился, несколько месяцев пропускал, но в феврале опять попробую, дабы оценить результаты основанные на бОльшей выборке данных. Так-то спасибо Скотту Каллену, превратил рубль в рубль десять. Но всё же надо ему лучше над моделью своей поработать. По ощущениям, ставь я самостоятельно, процент был бы чуть повыше. Кстати есть идея попробовать порыбачить тотал на основании этой продвинутой статистики. Мне кажется, тут она даже полезнее окажется. На что только не решишься ради науки…
Что касается Алана Райдера, он, как оказалось, по сей день чего-то обсчитывает. Пока не разобрался, что именно, но вот ссылка на его твиттер: https://twitter.com/hockeynlytics
А у Никиты Гусева дела на лад пошли. И уверенность обрёл, и доверие тренера, и стабильных партнёров по звену. Всё у него будет хорошо, не сомневайтесь.
Желаю побед Вашим любимым командам и удачи на ставках!