Волейбол - игра командная, но после турниров, туров и даже игр называются лучшие игроки. Команда командой, а личность интереснее - кто вносит наибольший вклад в победы, забивает, защищается, чье присутствие в игре приносит наибольшую пользу. Лучших определяют многие - федерации, организаторы турниров, специалисты, журналисты, тренеры и даже сами игроки. Авторы "Прекрасного Волейбола" тоже не остаются в стороне. Мы разработали собственную методику определения лучших игроков на основании статистических показателей и используем ее уже несколько лет. О самой методике мы расскажем в конце статьи, а начнем с представления лучших игроков сезона 2021/22.
Самый полезный игрок (MVP) сезона 2021/22 - Ксения Парубец (Уралочка-НТМК)
20 самых полезных игроков сезона 2021/22
Для игроков указаны выставленные им общие оценки по 10-балльной системе.
1. Ксения Парубец (Уралочка-НТМК) - 8.81
2. Ирина Воронкова (Локомотив) - 8.46
3. Ирина Филиштинская (Локомотив) - 7.90
4. Наталия Гончарова (Динамо М) - 7.83
5. Элица Василева (Динамо М) - 7.73
6. Татьяна Кадочкина (Динамо-Ак Барс) - 7.67
7. Алена Кондрашова (Уралочка-НТМК) - 7.61
8. Ирина Капустина (Липецк) - 7.46
9. Татьяна Маркевич (Минчанка) - 7.06
10. Анна Подкопаева (Динамо-Ак Барс) - 7.04
11. Виктория Пушина (Протон) - 6.98
12. Татьяна Ежак (Локомотив) - 6.95
13. Анастасия Бавыкина (Тулица) - 6.95
14. Мария Бибина (Динамо М) - 6.94
15. Мария Фролова (Енисей) - 6.91
16. Вита Акимова (Динамо-Метар) - 6.90
17. Вера Ветрова (Динамо Кр, Динамо-Ак Барс) - 6.87
18. Ирина Фетисова (Динамо М) - 6.85
19. Татьяна Романова (Динамо М) - 6.83
20. Анастасия Гарелик (Ленинградка) - 6.80
Dream Team сезона 2021/22
1-я Dream Team
Связка: Ирина Филиштинская (Локомотив).
Диагональ: Наталия Гончарова (Динамо М).
Доигровка: Ксения Парубец (Уралочка-НТМК), Ирина Воронкова (Локомотив).
Центр/блок: Виктория Пушина (Протон), Ирина Фетисова (Динамо М).
Либеро: Анна Подкопаева (Динамо-Ак Барс).
2-я Dream Team
Связка: Алена Кондрашова (Уралочка-НТМК).
Диагональ: Вита Акимова (Динамо-Метар).
Доигровка: Элица Василева (Динамо М), Ирина Капустина (Липецк).
Центр/блок: Елизавета Котова (Уралочка-НТМК), Ирина Королева (Динамо-Ак Барс).
Либеро: Мария Бибина (Динамо М).
3-я Dream Team
Связка: Вера Ветрова (Динамо Кр, Динамо-Ак Барс).
Диагональ: Анастасия Гарелик (Ленинградка).
Доигровка: Татьяна Кадочкина (Динамо-Ак Барс), Татьяна Маркевич (Минчанка).
Центр/блок: Елизавета Фитисова (Уралочка-НТМК), Юлия Подскальная (Динамо Кр).
Либеро: Анастасия Пестова (Ленинградка).
История
В предыдущие сезоны MVP чемпионата России становились:
2020/21 - Наталья Перейра (Динамо М)
2019/20 - Ксения Парубец (Уралочка-НТМК)
2018/19 - Ксения Парубец (Уралочка-НТМК)
2017/18 - Наталия Гончарова (Динамо М)
2016/17 - Ксения Парубец (Уралочка-НТМК)
2015/16 - Шинейд Джек (Уралочка-НТМК)
2014/15 - Екатерина Гамова (Динамо-Казань)
2013/14 - Екатерина Гамова (Динамо-Казань)
Основы методики определения лучших игроков
Идея методики заключается в том, чтобы накопить достаточное количество статистических показателей игроков и обработать их известными методами анализа данных. Существенную помощь в этом деле нам оказывает компьютер.
Сразу скажу, что полного описания методики здесь не будет. Хотя бы потому, что этот материал - не научный трактат, а популярная статья, предназначенная для любителей волейбола. Вряд ли они захотят глубоко вникать в дебри функций распределения, математических ожиданий, дисперсий, уровней доверия, корреляций, интерполяций и тому подобных понятий и формул, для описания которых нет даже клавиш на клавиатуре. Здесь я даю обзорное описание методики. А те, кто дочитает материал до конца, все поймут и захотят узнать подробнее, наверняка найдут формулы и методы в учебниках, а может быть, предложат другие и даже лучшие методы.
Исходные данные
Данные для составления рейтингов берем из статистических отчетов, предоставляемых сайтом Волей Сервис. Это лучшее из того, что нам сейчас доступно в открытых публикациях. Пример такого отчета можно посмотреть по ссылке.
Какие же данные мы видим в этом отчете? Их не так уж и мало.
- Данные об игре: дата игры, игравшие команды, счет игры (общий и по партиям), время игры (общее и по партиям).
- Данные игроков: игровой номер, фамилия, имя, в какой из партий выходил на площадку, в какой зоне (в старте) или не в старте.
- Показатели игроков: количество набранных очков; +/- - разность между набранными очками и ошибками; подача: общее количество, количество ошибок, количество очков; прием: общее количество, количество ошибок, процент позитивных, процент отличных; атака: общее количество, количество ошибок, количество заблокированных, количество очков, процент реализации; блок: количество очков, количество ошибок (присутствовал в отчете до сезона 2021/22).
- Командные показатели за игру: суммарные за игру для каждой команды (все, указанные в "Показатели игроков").
- Командные показатели с разбивкой по сетам: очки, набранные ошибками соперников; суммарные за сет для каждой команды (все, указанные в "Показатели игроков", относящиеся к подаче, приему, атаке и блоку).
Данных достаточно много. По крайней мере их вполне достаточно, чтобы выстроить модель, определяющую рейтинг игроков. Из них выберем нужные, отбросим лишние, некоторые "переформатируем", после чего загрузим в базу данных компьютера.
И все-таки этих данных для построения хорошей модели не хватает. Например, для расчета рейтинга игроков в отдельном туре нужно знать хотя бы номер этого тура. В отчете его нет. Что ж, придется его занести вручную из календаря на сезон.
Очевидно, что ценность показателей игрока зависит от его позиции (связующий, либеро и т.д.). В отчете позиция не указана. Для каждого игрока известна его основная позиция, но она не всегда соблюдается. Позицию можно визуально определить по зонам, в которых игрок выходил в стартовом составе. Проверяем, и если нужно, позицию подправляем (опять же вручную).
Очень редко, но бывает, что в одной игре в разных сетах игрок выходит на разных позициях. В этом случае считаем его позицию той, на которой он провел больше времени.
Построение модели
На настоящий момент в нашей базе данных есть данные о 1308 играх российской Суперлиги, в которых учтены 4415 игр связующих, 3861 игр диагональных, 7902 игр доигровщиц, 7040 игр центральных блокирующих, 4048 игр либеро (всего 27266 единиц игрок/игра).
По этим статистическим подборкам выстроим модели игроков раздельно по их амплуа: связующие, диагональные, доигровщицы, центральные блокирующие, либеро.
Показатели игроков используем только числовые и не пересекающиеся между собой:
- подача: обычные, ошибки, очки;
- прием: ошибки, негативные, хорошие, отличные;
- атака: обычные, ошибки, заблокированные, очки;
- блок: очки, ошибки.
Если значения показателя нет в отчете, вычисляем его значение из других показателей. Например, "обычные подачи" = "всего подач" - "ошибки на подаче" - "очки на подаче".
Кроме того, по возможности точно вычисляем:
- время нахождения игрока на площадке. Мы будем применять две единицы измерения времени: "сет" - количество сыгранных сетов и "мяч" - количество очков, разыгранных в этих сетах. Учтем сеты, начатые в стартовом составе, сеты, где игрок выходил на замену, и вычислим или оценим количество проведенного времени.
- силу команды соперника, против которого играл игрок. Для определения силы команд строится отдельная модель, анализирующая результаты игр команды в сезоне - модель рейтинга команд.
- некоторые командные показатели. К примеру, качество игры связки очень тесно коррелирует с качеством атак всей команды и качеством приема команды.
- командную составляющую, определяемую из результата игры. При этом используются данные модели рейтинга команд.
Вот мы и столкнулись с тем, что некоторые (зачастую очень важные) данные точно определить не всегда возможно. Эта проблема в математической статистике решается дополнением показателя уровнем доверия и/или доверительным интервалом.
Для каждого амплуа проанализируем, как исходные данные влияют на результат игры команды - по отдельности и в совокупности. При этом также используются данные модели рейтинга команд. В результате получаем функцию, результатом которой и будет сила игрока, зависящая от всех выше перечисленных параметров. Остается только результаты функций по каждому амплуа пронормировать и привести к единой расчетной шкале. В нашей модели рейтинг игрока оценивается значением от 0 до 10.
Таким образом, мы получили оценку каждого игрока в каждой из игр. Для определения рейтинга игрока за несколько игр (например, за весь турнир) мы производим анализ оценок по этим играм и вычисляем их (оценок) математическое ожидание.
Итог
Если посмотреть на результаты, то они, как правило, близки к оценкам общественности, которая дается в обзорах, статьях, комментариях и прочих материалах о волейболе. Поэтому методика вполне может иметь право на существование. Конечно, она далека от идеала, но в этом вопросе (как и в любом другом) идеал вообще недостижим. Основные ее достоинства:
- игроки рейтингуются на основании официальных данных игровых показателей, опубликованных в открытых источниках;
- правила рейтингования можно применить ко всем игравшим игрокам, для всех они одни и те же;
- в рейтинге не присутствует субъективная составляющая (личные впечатления или предпочтения) - все вычисления производит компьютер;
- компьютер позволяет обработать очень большие объемы данных, что практически невозможно для "ручной" обработки.
И в конце концов, если методы математической статистики позволяют предсказывать погоду, рассчитывать технологические процессы производства, определять пути поиска полезных ископаемых и еще много-много чего, то почему бы им не вычислять рейтинги спортсменов?
Конечно, исходных данных явно не хватает. Например, в отчетах FIVB имеются данные об игре в защите, о качестве паса, более развернутые данные игры на блоке - они были бы очень полезны и в наших отчетах. Но возможно, они тоже появятся, тогда мы включим и их в обработку.
И в заключение - мы не претендуем на абсолютность и даже какое-нибудь глобальное признание нашей методики. Это скорее обычное хобби авторов. Но (вернемся к началу статьи) - рейтинги игроков у многих вызывают интерес, и мы тоже вносим, пусть небольшой, но вклад в эту тему. Может быть, наши результаты будут интересны кому-нибудь еще.