728 подписчиков

Виды метрик в Машинном обучении

27 апреля 202327 апр 2023

181

1 мин

В Машинном обучении (ML) используются различные метрики, которые позволяют оценить качество работы моделей машинного обучения. Некоторые из наиболее распространенных метрик: ‌ Это только некоторые из наиболее распространенных метрик. В зависимости от типа задачи и используемого алгоритма могут быть использованы и другие.

Среднеквадратическая ошибка (MSE) измеряет отклонение прогнозируемых значений от фактических и возводит разность в квадрат. Последнее необходимо, чтобы получить дистанцию между реальным и спрогнозированным: простая разность может быть отрицательным числом, и это исказит расчеты. Она часто используется для задач Регрессии (Regression).
Средняя абсолютная ошибка (MAE) измеряет среднюю разницы между прогнозируемыми и фактическими значениями числовой переменной. Она рассчитывается путем взятия абсолютной разницы (модуля числа) между каждым прогнозируемым и соответствующим ему фактическим значением, а затем среднего значения всех этих абсолютных различий.
Коэффициент детерминации (R-Squared) измеряет, насколько хорошо прогнозируемые значения соответствуют фактическим значениям. Она также часто используется для задач регрессии.

‌

Доля правильных ответов (Accuracy) измеряет долю верных решений модели на тестовом наборе. Она часто используется для задач Классификации (Classification).
Точность (Precision) - это метрика, которая измеряет долю правильно предсказанных положительных ответов относительно всех предсказанных. Она также часто используется для задач классификации.
Полнота (Recall) измеряет долю правильно предсказанных положительных ответов относительно всех истинно положительных ответов в тестовом наборе данных. Она также часто используется для задач классификации.
F1-мера (F1-score) объединяет точность и полноту в одно число, и позволяет оценить баланс между этими двумя метриками. Она также часто используется для задач классификации.

Это только некоторые из наиболее распространенных метрик. В зависимости от типа задачи и используемого алгоритма могут быть использованы и другие.