1701 читали · 4 года назад
Pipeline в Машинном обучении простыми словами
Пайплайн – 1. Последовательные стадии работы с данными, включающие как извлечение данных, скраббинг (очистку), Разведочный анализ данных (EDA), моделирование, интерпретацию и пересмотр. 2. Класс библиотеки Scikit-learn, последовательно применяющий к исходным данным настраиваемые преобразования. 3. Автоматизируемая последовательность обучения и оптимизации модели в PyTorch и других библиотеках. Пайплайн как последовательность: Извлечение Этот этап включает сбор данных из Интернета или баз данных и конвертация в определенные форматы...
180 читали · 4 года назад
Как создавать собственные трансформаторы в Scikit-Learn
Расширьте встроенную функциональность с помощью собственных инструментов предварительной обработки, совместимых с конвейером Все мы знаем, как важна предварительная обработка в проекте машинного обучения...