На самом деле всё проще, чем кажется! Для тех кто в танке -
Линейная регрессия алгоритм, который применяется в машинном обучением. Этот алгоритм один из самых простейших!
Так же будет реализация этого алгоритма на python!
Я решил, что впихивать формулы будет очень просто и скучно!
Так что радуйтесь! Формул не будет! Будут картинки!
По этой картинке видно, что алгоритм очень прост! Если говорить, что он делает в графике, то он пытается найти линию, которая максимально захватит все точки! Можно сказать она должна их разделять!
НО ЛИНИЯ ДОЛЖНА БЫТЬ ПРЯМОЙ
Если вдруг происходит, что линия начинает быть такой
Это называется переобучением, когда алгоритм максимально подстраивается под данные, а не обобщается!
Так же есть не до обучение, но мне кажется это и так понятно, в будущем затронем и эту тему!
И обещанная реализация на python!
- from sklearn.linear_model import LinearRegression
- import pandas as pd
- url = 'csv файл'
- data = pd.read_csv(url)
- features, target = data.Столбец, data.Столбец
- ols = LinearRegression ()
- ols = ols.fit( features, target )
- ols.score( features, target )
Вот и реализация
P.S На самом деле мы переобучили модель, надо делать всё по частям,
Но об это в другой статье! :)
Огромное спасибо за внимание! Задавайте вопросы!
(Статья написана командиром команды "1XS")