Найти в Дзене
Властелин машин

Композитная трансформация колонок

Рассмотрим композитные трансформаторы значений колонок, которые можно применять в пайплайнах для избирательных преобразований. Например, если требуется к части колонок применить энкодер, а к другой нормализатор. Создадим демонстрационный датафрейм:

Посредством метода make_column_transformer можно задать набор кортежей, в каждом из которых задаются класс преобразования и набор имен колонок, к которым оно применяется:

-2

Если требуется задать выбор столбцов через сложные условия, можно воспользоваться make_column_selector:

зададим выбор колонок по типу:

-3

или по регулярному выражению (аргумент pattern):

-4

Аргумент remainder позволяет задать поведение в отношении оставшихся колонок. Так как по умолчанию они исключаются, чтобы сохранить, задайте remainder='passthrough':

-5

В целом make_column_transformer создает объект класса ColumnTransformer с заданными по умолчанию именами преобразований:

-6

Соответственно, композитную трансформацию можно создать с ColumnTransformer:

-7
-8