688 читали · 5 лет назад
Делаем проект по машинному обучению на Python. Часть 2
Собрать воедино все части проекта по машинному обучению бывает весьма непросто. В этой серии статей мы пройдём через все этапы реализации процесса машинного обучения с использованием реальных данных, и узнаем, как сочетаются друг с другом различные методики. В первой статье мы очистили и структурировали данные, провели разведочный анализ, собрали набор признаков для использования в модели и установили базовый уровень для оценки результатов. С помощью этой статьи мы научимся реализовывать на Python...
5. Улучшаем нашу модель: масштабирование признаков и другие алгоритмы 📈 🤖
В предыдущем посте мы построили нашу первую модель машинного обучения для предсказания цен на жилье. Сегодня мы попробуем улучшить ее, используя масштабирование признаков и другие алгоритмы. 1. Почему масштабирование признаков важно? Многие алгоритмы машинного обучения, особенно те, которые основаны на вычислении расстояний (например, k-ближайших соседей, SVM), чувствительны к масштабу признаков. Если один признак имеет значения от 0 до 1, а другой – от 1000 до 10000, то второй признак будет оказывать гораздо большее влияние на результат, даже если он не является более важным...