В предыдущей статье мы начали цикл статей про матричное программирование. Многие ответы вы сможете найти там. А сегодня решим задачу масштабирование набора данных. Если вы не знаете, что такое масштабирование, для чего оно нужно, то вам сюда. Нам же надо знать, что на выходе мы должны получить такой же набор данных, только эти данные не должны превышать 1, и не быть меньше 0. Другими словами нам надо выполнить те же действия, что и функция MinMaxScaler библиотеки sklearn (раздел preprocessing). Вопрос изобретения велосипеда обсуждался в предыдущей статье, если вас это беспокоит, то вернитесь к ней. Как мы будем масштабировать данные от 0 до 1? Для каждой колонки (параметра) получим максимальное и минимальное значение по этой колонке. Масштабированное значение будет равно разнице исходного значения и минимального по этому столбцу, поделенному на разницу между максимальным и минимальным значением этого столбца. Для наглядности давайте разберем на примере. Допустим у нас есть такой набор