1500 читали · 3 года назад
Pipeline в Машинном обучении простыми словами
Пайплайн – 1. Последовательные стадии работы с данными, включающие как извлечение данных, скраббинг (очистку), Разведочный анализ данных (EDA), моделирование, интерпретацию и пересмотр. 2. Класс библиотеки Scikit-learn, последовательно применяющий к исходным данным настраиваемые преобразования. 3. Автоматизируемая последовательность обучения и оптимизации модели в PyTorch и других библиотеках. Пайплайн как последовательность: Извлечение Этот этап включает сбор данных из Интернета или баз данных и конвертация в определенные форматы...
Pipeline в машиннном обученнии
Основная цель создания пайплайна - это контроль. Хорошо организованный пайплайн делает реализацию более гибкой. И вот на работе возникла необходимость рефакторить пайплайны и я решил внести некоторые улучшения в них. Решил поделиться с вами несколькими мини постами. Первое, что я сделал это перешёл на новую структуру проекта: cookiecutter Эта структура достаточно логичная, стандартизированная и гибкая. Всё что вам нужно, установить его и стартануть проект: pip install cookiecutter cookiecutter -c v1 https://github...