Найти тему

Виды метрик в Машинном обучении

Песчаная кошка. Фото: treehugger.com
Песчаная кошка. Фото: treehugger.com

В Машинном обучении (ML) используются различные метрики, которые позволяют оценить качество работы моделей машинного обучения. Некоторые из наиболее распространенных метрик:

  • Среднеквадратическая ошибка (MSE) измеряет отклонение прогнозируемых значений от фактических и возводит разность в квадрат. Последнее необходимо, чтобы получить дистанцию между реальным и спрогнозированным: простая разность может быть отрицательным числом, и это исказит расчеты. Она часто используется для задач Регрессии (Regression).
  • Средняя абсолютная ошибка (MAE) измеряет среднюю разницы между прогнозируемыми и фактическими значениями числовой переменной. Она рассчитывается путем взятия абсолютной разницы (модуля числа) между каждым прогнозируемым и соответствующим ему фактическим значением, а затем среднего значения всех этих абсолютных различий.
  • Коэффициент детерминации (R-Squared) измеряет, насколько хорошо прогнозируемые значения соответствуют фактическим значениям. Она также часто используется для задач регрессии.
Подсчет R2: взаимосвязь веса мыши и ее длины. Тонкие черные линии измеряют и возводят в квадрат. https://youtu.be/2AQKmw14mHM
Подсчет R2: взаимосвязь веса мыши и ее длины. Тонкие черные линии измеряют и возводят в квадрат. https://youtu.be/2AQKmw14mHM

  • Доля правильных ответов (Accuracy) измеряет долю верных решений модели на тестовом наборе. Она часто используется для задач Классификации (Classification).
  • Точность (Precision) - это метрика, которая измеряет долю правильно предсказанных положительных ответов относительно всех предсказанных. Она также часто используется для задач классификации.
  • Полнота (Recall) измеряет долю правильно предсказанных положительных ответов относительно всех истинно положительных ответов в тестовом наборе данных. Она также часто используется для задач классификации.
  • F1-мера (F1-score) объединяет точность и полноту в одно число, и позволяет оценить баланс между этими двумя метриками. Она также часто используется для задач классификации.

Это только некоторые из наиболее распространенных метрик. В зависимости от типа задачи и используемого алгоритма могут быть использованы и другие.

Подари чашку кофе дата-сайентисту ↑
Подари чашку кофе дата-сайентисту ↑

Наука
7 млн интересуются