В этой статье мы познакомимся с методом линейной регрессии для построения модели, описывающей взаимодействие между двумя непрерывными величинами. Используем полученную модель для прогноза. Анализ будет выполнен в аналитической платформе KNIME. C предыдущими статьями, в которых проводился разведочный анализ, построение графиков и расчёт описательных статистик, можно ознакомиться здесь Знакомство, здесь Визуализация и здесь Описательные статистики. Мы будем исследовать зависимость показателя В среднем руб. на текущем счёте на человека от Средней зарплаты Процесс подготовки данных и подбора модели представлен на Рис.1 Подготавливаем данные Как и в предыдущих статьях данные о показателях относятся к Амурской области. Прочитаем их из файла, используя узел CSV Reader. Применим экспериментальный узел Row Filter (Labs) с настройками на Рис. 2 В анализируемом датасете остались только сведения о показателях В среднем руб. на текущем счёте на человека и Средняя зарплата за период 2017-2018 г
Построение простейшей модели линейной регрессии в KNIME
7 января 20207 янв 2020
602
2 мин