Найти в Дзене
Властелин машин

Анализ выживаемости с Python

Построим модель выживаемости, которая поможет установить зависимость между временем и вероятностью наступления/ненаступления некого события.

Не исключено, что название метода возникло вследствие первоначального использования его для предсказания шансов того, что человек проживет от начального до установленного момента времени после наступления события.

Однако модель выживаемости можно использовать для решения более широкого спектра задач - определения вероятности покупки товара, клика мышью на рекламном объявлении, поломки оборудования в зависимости от времени.

В основе модели лежит функция выживаемости, которую можно построить по уже имеющимся данным за прошлые периоды. В частности, ее значение в момент времени t соответствует произведению вероятностей выжить во все предыдущие моменты времени (каждая фактически равна доле объектов, для которых событие еще не наступило).

Для примера рассмотрим задачу описания вероятности отсутствия поломки у машин различных типов. При этом мы располагаем историческими данными вида - тип машины, флаг наличия дефекта, дата поломки, дата поставки (начала эксплуатации), разница между этими датами (в месяцах):

Код для генерации данных представлен ниже:

-2

Имея заданный набор, построим функцию выживаемости для машин типа type2:

-3

Получившийся график выживаемости имеет следующий вид:

-4

-5