DVC - это продукт эволюции машинного обучения и предназначен для упрощения работы дата аналитика. В частности, он помогает создавать версии данных и моделей (большие файлы) и тем самым упорядочит ваш проект так, что его станет проще запускать коллегам, извлекать нужные версии и сравнивать результаты разных подходов. Многие принципы DVC заимствовал у Git-а, который делает то же, но для кода и небольших файлов. Сначала расскажу в целом о командах для версионирования данных, а потом рассмотрю их на практическом примере. Для начала работы с DVC требуется вызвать команду: dvc init После появится папка .dvc для хранения информации о конфигурации, например, файл config, в котором хранится информация о настройках. Затем следует добавить путь к удаленному хранилищу данных, там и будут фактически находится версионированные данные: dvc remote add -d название путь Ключ -d сообщает DVC, что это удаленное хранилище по умолчанию, в целом можно добавлять несколько хранилищ. Для начала слежения за фай
Версионирование с DVC, которое упорядочит работу с данными и ml экпериментами
13 августа 202313 авг 2023
99
2 мин