13,7K подписчиков
Источник: Nuances of Programming Данные и алгоритмы находятся в центре внимания специалиста по науке о данных. Понимание данных помогает ему принимать приоритетные решения, а понимание алгоритмов  —  моделировать данные в соответствии с точными расчетами. Линейная регрессия считается отправным пунктом, с которого новички в области науки о данных приступают к моделированию данных. Цель этой статьи  —  дать представление об алгоритме линейной регрессии, его реализации на языке программирования Python и практическом применении...
1 год назад
13,7K подписчиков
Источник: Nuances of Programming В первой статье цикла мы разбирались, что означает “подогнать линию” (или “линейная регрессия”). Мы объяснили интуитивный подход, лежащий в основе алгоритма, и результат, которого хотим добиться, подгоняя линию к данным. Мы пришли к выводу, что “подогнать линию” означает получить линию, которая располагается как можно ближе к точкам данных. Нужно ли, чтобы эта линия была максимально близка к каждой точке, и возможно ли это вообще? Ответим на эти вопросы чуть ниже...
1 год назад
10 подписчиков
Напишем код, чтобы решить простую задачу: оценить множественную линейную регрессию в Python. Данные импортируются из Excel. Будем для примера оценивать модель y=const+b1*x1+b2*x2+b3*x3+b4*x4+b7*x7+u, используя данные из файла filename.xlsx. Зависимой переменной является у, независимыми переменными выступают x1, x2, x3, x4, x7. В модели есть константа const. Случайная ошибка в самой модели у нас обозначается как u. Поехали: import pandas as pd df = pd.read_excel(r'C:\...\filename.xlsx') #читаем данные из excel. Здесь предполагается, что в файле единственная вкладка. Если она не единственная, можно...
1 год назад