Найти в Дзене
Властелин машин

Анатомия пайплайнов, рассеиваем туман над сложной структурой данных

Оттого что мысли мои не облекаются в слова, чаще всего они остаются хлопьями тумана. Они принимают смутные, причудливые формы, набегают одна на другую, и я тотчас их забываю (Жан-Поль Сартр). Разберем ключевые свойства sklearn пайплайна (pipeline) и приемы их модификации. Сначала создадим демонстрационный датафрейм: Теперь определим пайплайн: Обращаемся к элементам пайплайна Это можно сделать через свойство named_steps: Также к составляющим пайплайна можно обратиться как к словарю, в качестве ключа используя имя этапа: Обращаемся к ColumnTransformer Одним из распространенных структурных элементов пайплайна является ColumnTransformer, для обращения к элементам которого можно использовать свойство named_transformers_ или transformers_: Get/Set params Общим интерфейсом для получения параметров объектов sklearn выступает метод get_params. Этот способ работает как с пайплайнами, так и их структурными элементами: Заменим набор колонок для кодирования в трансформаторе, входящем в пайплайн. С
Оглавление

Оттого что мысли мои не облекаются в слова, чаще всего они остаются хлопьями тумана. Они принимают смутные, причудливые формы, набегают одна на другую, и я тотчас их забываю (Жан-Поль Сартр).

Разберем ключевые свойства sklearn пайплайна (pipeline) и приемы их модификации. Сначала создадим демонстрационный датафрейм:

Теперь определим пайплайн:

-2

Обращаемся к элементам пайплайна

Это можно сделать через свойство named_steps:

-3

Также к составляющим пайплайна можно обратиться как к словарю, в качестве ключа используя имя этапа:

-4

Обращаемся к ColumnTransformer

Одним из распространенных структурных элементов пайплайна является ColumnTransformer, для обращения к элементам которого можно использовать свойство named_transformers_ или transformers_:

-5

Get/Set params

Общим интерфейсом для получения параметров объектов sklearn выступает метод get_params. Этот способ работает как с пайплайнами, так и их структурными элементами:

-6

Заменим набор колонок для кодирования в трансформаторе, входящем в пайплайн. Сначала получим значение атрибута transformers:

-7

Затем сформируем новой значение:

-8

Установка свойств происходит через метод set_params. Запустим преобразования до замены параметра и после:

-9

Просмотр названий признаков пайплайна

Осуществляется методом get_feature_names_out:

-10

То же для трансформатора:

-11

-12