Эпсилон (ε, epsilon) – 1. (В статистике) Степень эффекта (Effect Size), используемая для сравнения. 2. (В Машинном обучении) порог некоторых классификаторов (например, sklearn.SGDClassifier), при котором становится менее важным получение точного прогноза.
В статистике
Например, лекарство A лучше, чем лекарство B, при лечении депрессии. Но насколько? Традиционная Проверка гипотез (Hypothesis Testing) не даст вам такого ответа. Лекарство B может быть в десять раз лучше, а может в два. Эта изменчивость (вдвое или в десять раз больше) и есть то, что называется величиной эффекта.
В статистике эпсилон в квадрате является мерой величины эффекта. Это один из наименее распространенных способов определения метрики: омега в квадрате и эта в квадрате используются чаще. Формула оценки эффекта выглядит следующим образом:
В Машинном обучении
При нечувствительности к эпсилону любые различия между текущим предсказанием и правильной меткой игнорируются, если они меньше этого порога. К примеру, Стохастический градиентный спуск (SGD), реализованный на scikit-learn, устанавливает epsilon по умолчанию равным 0.1:
Это позволяет неизвестным ранее парам значений (например, [0.95, 0.93]) не ухудшать своими ярлыками предсказательную способность модели:
Фото: @betagamma
Автор оригинальной статьи: statisticshowto.com