Найти в Дзене

Справедливый футбол: важное

Друзья, всех приветствую на данном канале!
Вероятно, каждый хотя бы раз после просмотра футбольного матча думал об одной из команд "повезло", "счёт не по игре", "отскочили". Подобные мысли часто всплывают в голове, когда ход матча с трудом соотносится с результатом. Но мы не всегда бываем объективны и чтобы понять, заслужила ли команда свои 3 очка или нет, нам нужен непредвзятый арбитр.
Данный проект - авторская попытка примерить на себя роль такого арбитра.
Метрика, по которой будет оцениваться наиболее справедливый исход матча - сопоставление xG (ожидаемых голов) двух игравших команд по следующим правилам:
0) Данные по xG берутся с сайта Understat
1) Если разница 0,00-0,39 xG - ничья (1 очко каждому)
2) Если разница 0,40-0,79 xG - 2 очка сильнейшей и 1 очко слабейшей команде
3) Если разница более 0,80 xG - 3 очка сильнейшей и 0 очков слабейшей команде
4) Каждый состоявшийся матч пересчитывается по данной системе
Затем составляется таблица лиги, учитывающая справедливое количе

Друзья, всех приветствую на данном канале!

Вероятно, каждый хотя бы раз после просмотра футбольного матча думал об одной из команд "повезло", "счёт не по игре", "отскочили". Подобные мысли часто всплывают в голове, когда ход матча с трудом соотносится с результатом. Но мы не всегда бываем объективны и чтобы понять, заслужила ли команда свои 3 очка или нет, нам нужен непредвзятый арбитр.

Данный проект - авторская попытка примерить на себя роль такого арбитра.

Метрика, по которой будет оцениваться наиболее справедливый исход матча - сопоставление xG (ожидаемых голов) двух игравших команд по следующим правилам:
0) Данные по xG берутся с сайта Understat
1) Если разница 0,00-0,39 xG - ничья (1 очко каждому)
2) Если разница 0,40-0,79 xG - 2 очка сильнейшей и 1 очко слабейшей команде
3) Если разница более 0,80 xG - 3 очка сильнейшей и 0 очков слабейшей команде
4) Каждый состоявшийся матч пересчитывается по данной системе

Затем составляется
таблица лиги, учитывающая справедливое количество очков за каждую игру тура



Ответы на наиболее вероятные вопросы:

0) Почему Understat?

Проект обладает большим авторитетом и опытом работы с футбольной статистикой ведущих европейских чемпионатов. Количество используемых при подсчёте xG метрик и качество аналитической работы также значительные, потому Understat можно считать одним из наиболее заслуживающих доверие источников в своей отрасли.

1) Почему именно xG?

- Стоит признать, xG - не отражение силы команды, её тактического или индивидуального мастерства. Однако цель проекта - определить не наиболее способную команду, а ту, что была ближе всего к чемпионскому титулу.

xG - это показатель вероятности забитого гола.
Разница xG - это вероятность того, что одна команда превзойдёт другую в 1 или более мяч.

Разница xG идеально подходит для того, чтобы определить доминировавшую команду в единственном аспекте футбола, отвечающем за счёт на табло - опасности моментов, созданных у ворот соперника.

2) Почему не xPoints?

xPoints учитывает результаты команды в сумме, а не каждого матча по отдельности. Почему это хуже, чем разница xG?

Представим:
-
3-я команда лиги громит по xG аутсайдеров 2 матча подряд - ей начисляют практически максимум xPoints (3) за каждый матч.
- Другая команда,
1-я в чемпионате, выпускает против тех же 2 аутсайдеров второй состав и обыгрывает с разницей xG около 1 - ей начисляют около 2 xPoints за каждую игру.
- Затем эти команды встречаются друг против друга,
1-я команда лиги обыгрывает 3-ю с такой же разницей xG около 1 - ей начисляют около 2 xPoints, проигравшей команде - примерно 1 xPoints.

- В сумме:
У 1-й команды лиги - 2+2+2 = 6 xPoints
У 3-й команды лиги - 3+3+1 = 7 xPoints
(При том что 1-ая команда переиграла по xG всех своих соперников)

❗Проблема в том, что xPoints фокусируется на сверхточном вычислении вероятности победы, стремясь избавиться от даже минимальной погрешности.

xPoints тем самым обесценивает ряд тактических шагов и подходов, направленных на обеспечение минимального результата, излишнее поощряя разгромы команд и занижая рабочие победы в 1 мяч.

Разница xG призвана учитывать только то преимущество в опасности моментов, которое имеет высокую математическую значимость.

3) Почему существует средний диапазон (0,40-0,79 xG)? Почему порог именно 0,40 и 0,80 xG? И почему 2 очка?

Средний диапазон - возможность отделить команды, чей шанс на победу сильно зависел от вероятностей.

Нижний порог - 0,40 xG, поскольку это минимальное математически значимое преимущество. 0,30 xG можно набрать, сделав два стандартных удара со средне-дальней дистанции, что сложно назвать доминированием в создании опасных моментов. Ничья в данном случае справедлива.

Верхний порог - 0,80 xG, является эквивалентом 3-4 неплохих ударов средней опасности или пенальти. Это достаточное преимущество, чтобы перевес в 1 гол можно было считать справедливым.

2 очка сильнейшей команды в среднем диапазоне отражают вероятность ничьи/победы, равную 50/50. За два соответствующих исхода команда так же получила бы в сумме 4 очка.


4) Можно ли считать данную метрику на 100% справедливой?

Очевидно, на 100% справедливой метрики в оценке футбольных результатов не существует, да и справедливость у каждого тоже своя. Данный проект, тем не менее, создан, чтобы покрыть ключевые недостатки xPoints, как единственной альтернативной метрики. Буду очень рад услышать от вас советы по доработке метода (желательно хорошо обоснованные), а также всевозможные пожелания по формату блога, лигам, за которыми мы будем следить, и любым иным идеям по развитию канала. Всех рад видеть здесь!


Также подписывайтесь на тг-канал, где вас будет ждать эксклюзивный контент:
https://t.me/footballjstc
Справедливая таблица после 1 тура РПЛ 24/25:
https://dzen.ru/a/Z89v3j5eLF2dY2O2