176 прочтений · 1 год назад
Как определить взаимосвязь между категориями
Стандартным приемом для определения взаимосвязи между числовыми колонками является вычисление коэффициента корреляции Пирсона, однако с категориальными данными такой финт не пройдет, так как они, как правило, не упорядочены (читай тут). Рассмотрим способ, который можно использовать. Сначала сгенерируем тестовый набор данных, о присутствии автомобилей разных марок в заданных локациях: import numpy as np import pandas as pd np.random.seed(0) autos_l = ['BMW', 'Mercedes', 'VOLGA', 'GEEP'] locations_l = ['Russia', 'Germany', 'USA'] prob_d = {'BMW':[0...
152 прочтения · 11 месяцев назад
Тест Бреуша-Пагана на гетероскедастичность в Excel
Имеем уравнение регрессии, полученное на предыдущем занятии (https://dzen.ru/media/id/6230a6775dd3d039bd69cb6d/chast-1-mnojestvennaia-regressiia-v-excel-63b459147a5b092ebffe32a7): Так же были построены графики зависимостей квадратов остатков от величин Х1 и Х2 По расположению точек на графике можем предположить случайное рассеивание, т. е. квадраты остатков не зависят от величин Х1 и Х2 Проведем тест Бреуша-Пагана на наличие гетероскедастичности в модели. (гетероскедастичность – непостоянство дисперсий остатков случайных отклонений) Нулевая гипотеза теста: остатки в модели гомоскедастичны...