В Машинном обучении (ML) используются различные метрики, которые позволяют оценить качество работы моделей машинного обучения. Некоторые из наиболее распространенных метрик:
- Среднеквадратическая ошибка (MSE) измеряет отклонение прогнозируемых значений от фактических и возводит разность в квадрат. Последнее необходимо, чтобы получить дистанцию между реальным и спрогнозированным: простая разность может быть отрицательным числом, и это исказит расчеты. Она часто используется для задач Регрессии (Regression).
- Средняя абсолютная ошибка (MAE) измеряет среднюю разницы между прогнозируемыми и фактическими значениями числовой переменной. Она рассчитывается путем взятия абсолютной разницы (модуля числа) между каждым прогнозируемым и соответствующим ему фактическим значением, а затем среднего значения всех этих абсолютных различий.
- Коэффициент детерминации (R-Squared) измеряет, насколько хорошо прогнозируемые значения соответствуют фактическим значениям. Она также часто используется для задач регрессии.
- Доля правильных ответов (Accuracy) измеряет долю верных решений модели на тестовом наборе. Она часто используется для задач Классификации (Classification).
- Точность (Precision) - это метрика, которая измеряет долю правильно предсказанных положительных ответов относительно всех предсказанных. Она также часто используется для задач классификации.
- Полнота (Recall) измеряет долю правильно предсказанных положительных ответов относительно всех истинно положительных ответов в тестовом наборе данных. Она также часто используется для задач классификации.
- F1-мера (F1-score) объединяет точность и полноту в одно число, и позволяет оценить баланс между этими двумя метриками. Она также часто используется для задач классификации.
Это только некоторые из наиболее распространенных метрик. В зависимости от типа задачи и используемого алгоритма могут быть использованы и другие.