DataLad - это бесплатная и открытая система управления распределенными данными, которая предоставляет инструменты для отслеживания данных, создания структуры, обеспечения воспроизводимости, с развитой поддержкой сообщества и интеграцией с широко используемыми инструментами современной инфраструктуры данных. Отслеживание изменений в данных DataLad основан на Git и git-annex, что позволяет вам контролировать версии произвольно больших файлов в наборах данных без необходимости в специальных структурах данных или сложной инфраструктуры. Вы можете: - Отслеживать изменения в ваших данных - Возвращаться к предыдущим версиям - Вести полную историю происхождения данных - Обеспечивать полную воспроизводимость Сохранение и поддержка сложной иерархии в данных Набор данных DataLad представляет собой каталог с файлами, управляемый DataLad. Вы можете связывать другие наборы данных, известные как поднаборы данных, и выполнять команды рекурсивно по произвольно глубокой иерархии наборов данных. Это помо
Изучаем DataLad: систему управления данными и совместной работы
22 декабря 202322 дек 2023
30
2 мин