417 читали · 2 года назад
Кривая Лоренца (Lorenz curve) и коэффициент Джини (Gini coefficient)
Кривая Лоренца – график, характеризующий неравномерность распределения доходов среди населения. По оси абсцисс откладывается доля населения, а по оси ординат — доля доходов в обществе в процентном отношении. Допустим, в компании работают 4 человека с суммарным доходом 10000$. Равномерное распределение дохода — это 2500$ + 2500$ + 2500$ + 2500$, неравномерное – 0$ + 1000$ + 2000$ + 7000$. Теперь оценим неравномерность для случая 6000$ + 1000$ + 2000$ + 1000$. Упорядочим сотрудников по возрастанию дохода (1000$, 1000$, 2000$, 6000$)...
652 читали · 2 года назад
Как построить ROC - кривую и расчитать AUC в Excel
Почему возникла необходимость строить ROC - кривую в Excel? Ведь эта чудесная программка не приспособлена к вычислениям "data science" метрик, то есть не имеет готовых инструментов. В том же Python, написав небольшой блок кода, вы получите то, что хотели, без лишних движений. Так зачем? Первая модель, с которой я работал, была написана на языке R. Так уж получилось. Функционал я особо не знал, а хотелось поглядеть на те самые метрики, которые определяют успешность моей модели. ...