Гетероскедастичность – допущение о "неодинаковости" Дисперсии (Variance) переменной: Иными словами, разность между реальным и предсказанным значениями Y, скажем, Линейной регрессии (Linear Regresion) не остается в определенном известном диапазоне. Такой "разброс" не позволяет в принципе использовать такую Модель (Model). Это проблема, потому нарушается базовое предположение о линейной регрессии: все ошибки должны иметь одинаковую дисперсию. Самый простой способ узнать, присутствует ли гетероскедастичность, – построить график остатков (подробнее здесь): Если наблюдения располагаются на графике остатков неравномерно (часто конусообразно), то гетероскедастичность есть. Типичные причины гетероскедастичности: Чистая и нечистая гетероскедастичность Теперь, по вышеуказанным причинам, гетероскедастичность может быть чистой или нечистой. Когда мы подбираем правильную модель (линейную или нелинейную) и если еще есть видимая закономерность в остатках, это называется чистой гетероскедастичностью.
Heteroscedasticity в Машинном обучении простыми словами
15 января 202315 янв 2023
226
3 мин