Рассмотрим композитные трансформаторы значений колонок, которые можно применять в пайплайнах для избирательных преобразований. Например, если требуется к части колонок применить энкодер, а к другой нормализатор. Создадим демонстрационный датафрейм:
Посредством метода make_column_transformer можно задать набор кортежей, в каждом из которых задаются класс преобразования и набор имен колонок, к которым оно применяется:
Если требуется задать выбор столбцов через сложные условия, можно воспользоваться make_column_selector:
зададим выбор колонок по типу:
или по регулярному выражению (аргумент pattern):
Аргумент remainder позволяет задать поведение в отношении оставшихся колонок. Так как по умолчанию они исключаются, чтобы сохранить, задайте remainder='passthrough':
В целом make_column_transformer создает объект класса ColumnTransformer с заданными по умолчанию именами преобразований:
Соответственно, композитную трансформацию можно создать с ColumnTransformer: