Рассмотрим методы статистического анализа для выявления самых допинг зависимых бойцов UFC. К их числу отнесем тех, из-за употребления запрещенных веществ которыми отменялись результаты поединков.
Для подсчета воспользуемся массивом боев с сайта ufcstats.com, которые были скачаны и загружены в файл на локальном диске (подробности об этом читай здесь):
Для обработки сведений будем использовать Python и библиотеку Pandas. Прежде всего загрузим таблицу и извлечем все "безрезультатные" поединки (в столбцах Win_lose_left и Win_lose_right, содержат значение 'NC' ):
Отмечу, что результаты схваток, по истечении которых выявляется факт употребления допинга, отменяются, поэтому мы двигаемся в правильном направлении.
Теперь выведем имена бойцов, которые чаще других выступали в поединках с отсутствующим результатом. Для этого сначала соберем столбец из значений полей u_nc.Fighter_left и u_nc.Fighter_right, содержащих имена бойцов в левом и правом углу:
и вызовем метод value_counts, который собирает уникальные значения и их количество в столбец (объект Series):
У нас определилась четверка лидеров, но один из них лишь однажды повинен в отмене поединка за употребление допинга. Чтобы понять, кто есть кто, потребуется рассмотреть поединки с их участием из масссива u_nc.
Сначала создадим список из имен этих бойцов, а потом отфильтруем поединки с их участием в u_nc. Для решения первой задачи проведем последовательность операций:
Теперь решим задачу полностью:
Пересмотрев содержимое таблицы, я обнаружил, что Ридл, Силва и Прайс по два раза провалили допинг-тест, в то время как Кейси лишь однажды (другой раз бой остался без решения из-за тычка в глаз его соперником).
Так как имена бойцов