Минувшим летом в открытом научном журнале PLUS One был опубликован доклад Лондонского университета королевы Марии, который ставил перед собой задачу сравнить различные методы получения лучшего прогноза на матчи. Вот результаты данного исследования.
Доклад
Беттинговые коэффициенты часто превосходят математические модели, когда речь идет о задачах, связанных со спортивным прогнозом. Однако нельзя полностью проследить за факторами, влияющими на эти самые коэффициенты, и, в отличие от рейтинговых прогнозов, нельзя вычесть простые измерения из букмекерских коэффициентов.
Данная работа исследует подход совмещения методов математических моделей с информацией внутри беттинговых коэффициентов. Футбольная прогностическая модель, основанная на всем известной рейтинговой системе Эло и пользующаяся беттинговыми коэффициентами, в качестве источника информации хорошо известна.
При этом в исследовании были задействованы данные с почти 15 тысяч футбольных матчей (сезоны с 2007/2008 года по 2016/2017-й), включая как домашние игры в пяти европейских национальных чемпионатах, так и международные встречи (в Лиге чемпионов и Лиге Европы).
Новаторская Эло-модель, основанная на ставочных коэффициентах, показала свою способность превосходить классические Эло-модели, демонстрируя, таким образом, то, что беттинг-коэффициенты, взятые до матча, содержат в себе более актуальную информацию, чем непосредственно результат самого поединка.
Было показано, как новаторская модель в состоянии помочь получить ценные показатели качества футбольных команд и его развития на разных этапах времени. Иначе говоря, она имеет практическое аналитическое преимущество. Более того, существует даже мнение, что в дальнейшем данные подходы могут оказать помощь в улучшении рейтинговых и прогностических методов.
Вступление
Прогнозирование спортивных мероприятий наподобие футбольных матчей довольно долгое время привлекает внимание научного сообщества. Хотя бы потому, что обширные данные всегда доступны, и их относительно просто интерпретировать.
В связи с этими факторами, спорт (футбол в особенности) представляет собой идеальную среду для изучения и применения существующих прогностических методов на практике или для развития новых методов для перехода в новые сферы прогноза.
Поиск наиболее точных спортивных прогностических методов одновременно интересен с научной и экономической точек зрения, так как огромный беттинговый рынок футбола (и прочих видов спорта) предоставляет возможность выигрыша денег благодаря достоверному прогнозу.
Помимо составления точного предсказания исхода, прогностические модели также могут представлять ценность для понимания природы процессов, лежащих в основе и, как это показано в данном исследовании, для получения практических сведений анализа показателей в спорте.
Три различные задачи внесли основную лепту в сложность применения математических прогнозов к спортивным прогнозам. Во-первых, неизвестное качество команды (или игрока), которые нужно изучить, используя обширный и значимый набор данных, а также подходящую математическую модель.
Во-вторых, сам прогноз (то есть вероятность определенного исхода матча или турнира) должен быть получен с применением подобающих статистических методов. Таких, как модели вероятности или симуляция Монте-Карло.
Наконец, результаты прогноза нужно протестировать, сопоставив их с реальными данными, используя соответствующие статистические тесты. В этой работе мы будем называть эти три задачи рейтинговым процессом, прогностическим процессом и тестовым процессом.
Нами были исследованы различные источники прогноза в попытке понять прогностические процессы развития многообещающих методов и сравнения их прогностических возможностей. Эти источники можно разбить на четыре категории:
- Людское мнение. Это задача к участникам с разным уровнем знаний давать прогнозы на спорт.
- Ранжирование. Использование официальных рейтингов, таких, как FIFA World Ranking в футболе или ATP в теннисе, для получения прогнозов будущих матчей и турниров.
- Математические модели. Применение существующих или развивающихся новаторских математических и статистических подходов для прогнозирования результатов спортивных событий.
- Беттинговые коэффициенты. Использование коэффициентов, предложенных букмекерами в качестве прогноза на основные спортивные мероприятия.
Людское мнение
Многочисленные научные работы исследовали свойства людского прогноза в футболе, суть которого заключалась в том, чтобы так называемые «футбольные эксперты» превзошли простых смертных в составлении примитивных прогностических схем. И что же вы думаете?
Прогнозы от «простых смертных» оказались гораздо лучше, чем прогнозы от «экспертов». Более того, основная часть «заслуженных экспертов» была просто разгромлена «простыми» людьми, которые следовали стандартным правилам, заложенным в основу FIFA World Ranking.
Экспертные прогнозы, опубликованные на специализированных спортивных сайтах, в итоге показали даже худшие результаты, нежели примитивная модель, согласно которой вы тупо ставите на победу домашней команды.
Вместе с тем, исследования показали, что эксперты одерживают верх над обычными любителями спорта в более сложных прогностических задачах, таких, как точный счет или статистика матчей.
Ранжирование
Предсказательный характер реагирования подвергается сомнению по нескольким причинам. Ранжирование обычно ставит своей целью награду за успех, а не составление лучшей оценки игр конкретной команды и игрока.
Более того, спортивное ранжирование очень упрощено, и ему не хватает релевантной информации для честности и понятности. В то же время, опыт показал, что беттинговые коэффициенты или математические модели способны обыгрывать это ранжирование в плане прогностических задач.
Математические модели
Часто исследованным и широко принятым математическим подходом в спортивном прогнозировании является рейтинговая система Эло, являющая собой хорошо известный метод ранжирования и составления рейтингов спортивных команд или игроков.
Изначально она была разработана и применялась в шахматах, но со временем ее удалось применить и во множестве других видов спорта, включая европейский и австралийский футбол.
Хваттум и Арнтцен расширили знакомую рейтинговую систему Эло, используя модели «логит-регрессии» для вычисления вероятностей для трех видов исхода матча (Хозяева/Ничья/Гости), исходя из рейтингов Эло. Система Эло доказала свое превосходство над моделями, основанными на регрессии «пробитов», созданной Годдардом.
Тем не менее, букмекерским коэффициентам она всё же уступила.
Беттинговые коэффициенты
Данные коэффициенты можно рассматривать в качестве совокупного экспертного мнения, отражающего как суждения букмекеров, так и ставочного поведения толпы. Однако они в корне отличаются от экспертного мнения, сопоставленного с исследованиями, в которых экспертам дали задание составить прогностические задачи в экспериментальной среде.
В то время как таким экспертам обычно не приходится тревожиться о негативных последствиях из-за своих недостоверных прогнозов, ошибки букмекеров в коэффициентах будут иметь для оных серьезные финансовые последствия.
Это можно считать как раз причиной того, почему беттинговые коэффициенты показали свое явное преимущество перед футбольными экспертами, публиковавшими свои прогнозы на спортивных сайтах.
Хваттум и Арнтцен показали, что в общей сложности беттинговые коэффициенты обладают превосходными предсказательными свойствами и прогнозируют результаты футбола куда лучше некоторых количественных моделей.
Консенсусная модель, основанная на беттинговых коэффициентах различных букмекеров, предоставила более достоверные прогнозы по чемпионату Европы 2008 года, чем методы, используемые рейтингом Эло и FIFA World Ranking.
Ковальчик даже изучил одиннадцать прогностических моделей в теннисе и выяснил, что ни одна из них не была в состоянии превзойти букмекерские коэффициенты в прогнозах на одиночные матчи.
Не отрицая общую прогностическую способность беттинговых коэффициентов, стóит отметить, что существуют эмпирические показатели их несовершенства, что было показано в широко задокументированных отклонениях, касающихся темы дальних ударов. Вдобавок, следует отметить, что различные подходы, основанные на моделях, приносили положительные результаты при изъятии беттинговых стратегий из прогнозов.
Значимая часть вышеупомянутых исследований фокусируется на соотношении четырех разных источников прогнозирования или разных подходов к одному и тому же источнику прогноза.
С учетом существования обширного консенсуса вокруг того, что беттинговые коэффициенты являют собой мощный прогностический инструмент, беттинговые коэффициенты регулярно используют в качестве эталонного теста прогностического качества математических подходов.
Делая это, коэффициенты букмекеров и математические модели противопоставляются тем же прогностическим задачам – вместо совмещения сильных сторон обеих систем для создания новых прогностических возможностей.
На данный момент, мало какие исследования пытались обратить вспять прогностический процесс, используя существующие прогнозы (из числа беттинговых коэффициентов), выводы о качествах команд и полученных командных рейтингов. Чуть позже некоторые ученые проявили интерес к этой стратегии, воспользовавшись «инверсионной» симуляцией ЧЕ-2008 для получения рейтингов сборных из беттинговых коэффициентов для турнира.
Данный подход особенно наглядно демонстрирует разницу между качеством команды и ее шансами на победу в соревнованиях. Однако никакие беттинговые коэффициенты одиночных матчей не принимаются во внимание для определения командных рейтингов.
Хотя прогностические качества букмекерских коэффициентов часто включают обширную информацию, которая отражена в коэффициентах, ее, бесспорно, можно рассматривать как важное преимущество ставочных шансов. Хотя вопрос о ценности беттинговых коэффициентов уже прошедших матчей для предсказания будущих матчей пока что еще не был затронут.
Данный анализ расширяет предварительные исследования в различных аспектах. Мы представляем вниманию читателей новаторскую модель, способную объединить в себе преимущества математических подходов с информационным преимуществом беттинговых коэффициентов.
По своему предназначению эта модель не должна усовершенствовать прогнозы, исходя из беттинговых коэффициентов, но она ставит своей целью расширение рамок, дающих нам шанс исследовать явность предварительных прогнозов ради будущих прогнозов, конструировать рейтинг, улучшающий классические рейтинговые методы и, таким образом, использовать прогностические методы для достижения усовершенствованных практических сведений об анализе игры.
Мы детально исследовали вопрос о том, представляют ли букмекерские коэффициенты, полученные перед матчем, бóльшую ценность для прогностических целей, чем результаты, полученные по окончанию матча.
Рейтинг, использованный в качестве промежуточного шага для прогностических моделей, можно интерпретировать как противоположность прогностического процесса, так как мастерство футбольной команды вычисляется из информации, собранной из предыдущих прогнозов.
Мы используем этот рейтинг для демонстрации того, какие улучшения получают традиционные рейтинговые методы, а также того, как информация, включенная в букмекерские коэффициенты, может быть эффективно извлечена для задействования в практическом анализе, например, развития уровня футбольных команд.
Более того, мы продемонстрируем то, как модель коэффициентов Эло можно использовать для анализа развития качества отдельно взятых команд со временем.
И, наконец, мы продемонстрируем отсутствие теоретических основ рейтинговых моделей, способных перехватить инициативу у сетевых структур матчей путем применения их результатов к рейтингам посторонних команд.
Вторая часть на странице prtostoprosport.ru