В футбольной аналитике используют много статистических параметров. Сами по себе цифры обычно ничего не значат. Их всегда нужно рассматривать в контексте ситуации: как складывался тот или иной матч, какой стиль игры у команды, какая тактическая расстановка. Статистические параметры бывают точными и вероятностными. К первым относятся, например, число ударов в створ ворот, нарушений и т.п. Ко вторым же параметрам относят статистику xG. О которой мы сегодня и поговорим.
Что такое xG-статистика?
Цифры на табло иногда не отражают реальную ситуацию на футбольном поле. Неоднократно приходилось наблюдать, как команда бьет по воротам 15 раз и атакует весь поединок, но минимально проигрывает после одного попадания в створ. Действительно ли недостаточно хорошо отыграл проигравший? Если ответ положительный, то настолько плохо? А если отрицательный, то, как сильно не везло в завершающей стадии?
Именно xG старается дать ответы и как можно точнее оценить игру соперников.
xG – expected goals, в переводе – ожидаемые голы – это модель расчета ожидаемых забитых мячей, которая чаще всего основывается на опасности ударов по воротам. Вес каждого удара определяется на основе ряда параметров. Этот вес варьируется в зависимости от лиги.
Основные факторы, которые учитывают различные xG-модели:
• дистанция до ворот и точка, из которой был нанесен удар;
• часть тела, которой был нанесен удар;
• количество касаний игрока до удара;
• каким способом игрок получил мяч до удара – к примеру, с помощью навеса или благодаря проникающей передаче.
Суммируя веса каждого созданного момента, мы получаем результат матча, ожидаемый на основании этих моментов. К примеру, счет матча Спартак – ЦСКА в 20-м туре РПЛ 2017/2018 в цифрах xG выглядит так: 2.67 – 0.42. В реальности – 3:0.
По xG-модели, удары оцениваются коэффициентом. Сумма значений показывает опасность, создаваемую футболистами у ворот противника. Сравнение xG соперников позволяет сформировать и предположить возможный счет поединка.
Футбол – малорезультативный вид спорта. Результат отдельных событий зависит от случайностей: ошибки игрока или судьи, рикошета или отскока. В игре отсутствуют статические положения, а это усложняет подсчет статистических показателей и выделение основных моментов для объяснения исхода матча. Выигрыш команды по xG не означает выигрыш по счету, но дает понять, кто приложил больше усилий для успеха.
Системы xG-моделей применяются в клубах ТОП лиг. Наставник лондонского "Арсенала" однажды обмолвился, что предпочитает xG-модель. На тренировочных базах "Байера" и "Боруссии" Дортмунд показаны зоны, из которых желательно бить по воротам. Продвинутая xG статистика помогает определить уровень соперников, опираясь на различные факторы, а не только прошлые результаты.
"Overperform" и "Underperform" в xG-статистике
В упомянутом ранее матче Спартака и ЦСКА реальный счет соответствовал ожидаемому по xG. "Красно-белые" создавали много моментов, которые команда конвертировала в голы. Но так бывает не всегда. Например, матч "Арсенал" – "Манчестер Юнайтед" в 15-м туре АПЛ 2017/2018, который окончился со счетом 1:3. В числах xG счет этого матча должен был выглядеть так: 4.55 – 2.12. Существенная разница.
Значит ли это, что модель xG не может предсказывать матчи и не показывает мастерство команды в создании моментов? Не совсем. Методология xG помогает проанализировать то, насколько хуже или лучше команда выступила относительно моментов, которые она создала и допустила.
Все тот же матч "Арсенала" и "Манчестер Юнайтед" ознаменовался прекрасной игрой стража ворот "красных дьяволов" Давида Де Хеа. Он обновил свой же рекорд сезона 2017/2018 по числу сейвов в матче – 7. "Арсенал" действительно создавал много моментов, но мяч упорно не залетал в ворота. В этой встрече у "Арсенала" был сильный "Underperform" – выступление ниже ожиданий. Он составил +3.55 (xG-GF). Это означает, что команда достаточно много создала, но не конвертировала моменты в реальные голы.
В футболе не всегда получается превратить моменты в голы. Иногда это дело случая. Но на дистанции подобные расхождения становятся частью статистических флуктуаций. То есть по недобору голов в одном матче можно предположить, что в последующих команда исправится.
Другая крайность – это "Overperform" – выступление выше ожиданий. Он возникает тогда, когда команда забивает больше, чем показывает модель xG. Такое часто бывает. Канонический для пример этого явления – "Спартак" образца сезона 2016/17.
В том сезоне "Спартак" стал триумфатором первенства, но по xG был почти самым крупным "оверперформером". Проще говоря, его победы были неожиданными. Одним из примеров являются голы Дениса Глушакова с дальних дистанций, которые приносили победы "красно-белым". Такие удары имеют низкий вес: с подобных дистанций почти невозможно постоянно забивать и приносить результат. Тем не менее такими ударами были добыты важные победы "Спартака". Подобный ритм сложно поддерживать на дистанции в два и более сезонов.
Сложности xG-статистики
Есть несколько моментов, которые пока никак не учитываются xG-моделями. К примеру, ненанесенные удары. Представим ситуацию, что игрок вышел на ударную позицию, но промахнулся по мячу. Такой момент не будет учитываться в xG. Впрочем, на длительной дистанции – в сезон или несколько сезонов – подобное нивелируется.
Несмотря на проблемные элементы xG-системы, которые также включают трактовку автоголов, пенальти, непробитых ударов, на длительной дистанции xG-статистика достаточно близко отражает действительную силу команд. С начала сезона АПЛ 2017/2018 статистику xG стали представлять в эфире BBC наряду с другими статистическими параметрами, по которым оценивается матч, вроде процента владения мячом или точных передач.
Статистика xG и ставки на спорт
xG может быть полезен и в ставках на спорт. Нужно понимать, что это не единственный параметр, который следует использовать для ставок. Нужно всегда исходить из того, почему цифры вышли именно такими. Надо учитывать форму игроков и то, в каком состоянии они подходят к встрече.
Важно помнить и то, что любые статистические параметры склонны к регрессии к среднему. То есть статистический всплеск на дистанции нивелируется падением (дисперсия). Например, нападающему сложно удержать высокую результативность на длительной дистанции, через какое-то время он перестанет забивать больше ожидаемого по xG. Та же логика применима к командам. Удачные серии, когда команда создает меньше, чем в реальности забивает, заканчиваются. И такие серии можно отслеживать и прогнозировать.
Резюмируя вышесказанное
Статистика xG не способна объяснить все процессы, которые проходят в командах. При разборе событий важно учитывать не только цифры, но и составы оппонентов, игровую форму и мотивацию. В ближайшем поединке эти факторы больше скажутся на результате, нежели xG-модели.
Это вспомогательный инструмент, благодаря которому выявляются тренды и недооцененные или переоцененные исходы. Самостоятельно xG не используется. Сочетайте такой разбор с классическим анализом. Не полагайтесь исключительно на данные xG-таблиц. Они служат помощником и являются преимуществом в схватке с букмекером, а не самостоятельным "оружием".