Найти тему

Predictor Variable в Машинном обучении простыми словами

Фото: @katgo_83
Фото: @katgo_83

Предиктор (прогнозирующая переменная) – переменная, используемая для прогнозирования Целевой переменной (Target Variable). В общих чертах это можно представить следующей формулой:

-2

Пример. Мы хотим предсказать, уволится ли программист с текущей работы или нет. Нам необходимо проанализировать различные параметры, которые влияют на мышление сотрудника. Среди собранных в ходе исследования данных следующие Признаки (Features):

  • Удовлетворенность работой
  • Зарплата
  • Дистанция от дома до работы
  • Взаимоотношения с коллегами
  • Знание предметной области

Исследователи установили, что первые три метрики влияют на вероятность увольнения больше всего. Если сотрудник доволен работой, зарплатой и быстро добирается до офиса, то будет держаться рабочего места в случае изменений условий труда, будь то изменение технологии, с которой ему предстоит работать, или экономического благополучия организации:

Функциональные типы переменных
Функциональные типы переменных

Взаимоотношения с коллегами имеют условное влияние на взаимоотношения между целевой переменной и предикторами. Иными словами, такая модерирующая переменная повлияет на силу взаимосвязи между ними, но сама по себе не вынудит сотрудника искать новое место работы. Если разработчик удовлетворен проектами, которые реализует, зарплатой, соответствующей индустрии, и быстро добирается до работы, то появление токсичных коллег навряд ли вынудит его уволиться. Однако на вероятность уволиться все же повлияет.

Переменная-посредник объясняет взаимосвязь между независимыми и зависимыми признаками. Допустим, по некоторым причинам работодателю потребовалось мигрировать с одного языка программирования на другой. Теперь, если проанализировать ситуацию, то разработчик:

  • По-прежнему очень увлечен разработкой программного обеспечения
  • Доволен коллегами и компанией
  • Доволен доходом
  • Быстро добирается до офиса
  • Испытывает определенный стресс, поскольку вынужден работать с незнакомым языком программирования

В этом случае существует вероятность увольнения. Но все же предикторы "набрали достаточно очков" удовлетворенности рабочим местом, и разработчик не уйдет в отставку. "Знания предметной области" – это промежуточная переменная, и именно она в такой стрессовой для разработчика ситуации будет влиять на его адаптационную способность и сохранение удовлетворенности основными условиями труда.

Предиктор и Независимая переменная

Все эксперименты имеют дело с той или иной формой переменных, которые измеряют и трансформируют, которыми манипулируют. Переменную-предиктор часто ошибочно принимают за Независимую переменную (Independent Variable), однако их определения немного различаются. Если независимая переменная может быть преобразована на протяжении всего эксперимента, то предиктор – нет.