Оттого что мысли мои не облекаются в слова, чаще всего они остаются хлопьями тумана. Они принимают смутные, причудливые формы, набегают одна на другую, и я тотчас их забываю (Жан-Поль Сартр). Разберем ключевые свойства sklearn пайплайна (pipeline) и приемы их модификации. Сначала создадим демонстрационный датафрейм: Теперь определим пайплайн: Обращаемся к элементам пайплайна Это можно сделать через свойство named_steps: Также к составляющим пайплайна можно обратиться как к словарю, в качестве ключа используя имя этапа: Обращаемся к ColumnTransformer Одним из распространенных структурных элементов пайплайна является ColumnTransformer, для обращения к элементам которого можно использовать свойство named_transformers_ или transformers_: Get/Set params Общим интерфейсом для получения параметров объектов sklearn выступает метод get_params. Этот способ работает как с пайплайнами, так и их структурными элементами: Заменим набор колонок для кодирования в трансформаторе, входящем в пайплайн. С
Анатомия пайплайнов, рассеиваем туман над сложной структурой данных
11 мая 202311 мая 2023
50
1 мин