231 читали · 4 года назад
Предобработка данных. Нормализация данных. Python.
Часто данные в датасетах бывают разного масштаба, что очень мешает алгоритмам хорошо работать. В большинстве случаев прибегают к нормализации данных - приведению данных к одному масштабу. Основные методы: Два этих метода есть в библиотеке sklearn. MinMaxScaler - приводит независимо каждый признак к значению между 0 и 1. Для каждого признака мы находим минимальное и максимальное значение, из всех значений вычитаем минимальное значение и делим это на разницу между максимальным и минимальным значениями...
395 читали · 4 года назад
Работа со списками Python: шпаргалка
Методы, функции и варианты использования списков Python Написав несколько статей по таким темам, как эконометрика, логистическая регрессия и регуляризация, я вернулся к основам! Многие сложные алгоритмы анализа данных построены из простых строительных блоков...