Введение
Основная цель организации и аннотации научных данных состоит в том, чтобы предоставить исследователям эффективный механизм доступа к данным и обмена ими с более широким научным сообществом. Для достижения этих целей данные должны иметь как адекватное описание, так и быть представлены в структурированной форме, доступной для вычислительных инструментов. Модель нейровизуализации данных (NIDM) представляет собой постоянную попытку представить в единой модели различные компоненты исследовательской деятельности (например, участников, информацию о проекте, производные данные), их взаимосвязь и происхождение. В настоящее время NIDM имеет модульную конструкцию, состоящую из NIDM-Results, NIDM-Workflows и NIDM-Experiment. Рабочие процессы (Workflows) NIDM сфокусированы на описании каналов анализа данных и детальных программных вариациях. NIDM-результаты (Results) ориентирована на представление массовых и одиночных результатов нейровизуализации с использованием общего описательного стандарта для всех пакетов программного обеспечения. NIDM-эксперимент (Experiment) сосредоточен на представлении плана эксперимента, исходных данных, собранных в ходе эксперимента, и информации об участниках, включая общие оценки, демографические данные и информацию о посещениях. В этой аннотации представлено описание работы по созданию прототипов для представления оценок и метаданных, собранных в ходе типичного эксперимента по нейровизуализации.
Методы
NIDM разрабатывается с использованием процесса, управляемого сообществом, который привлекает заинтересованные стороны к участию в определении вариантов использования, способствующих развитию. Для поддержания связи используются очные семинары и еженедельные видеоконференции, а членами рабочей группы INCF-NIDASH разрабатываются примеры документов, спецификаций и программного обеспечения NIDM. NIDM является продолжением рекомендованной W3C модели данных о происхождении для получения производных данных и описаний экспериментов в нейровизуальных областях.
Этот шаблон моделирует метаданные из систем управления данными нейровизуализации на трех уровнях:
- исследование;
- сессия;
- серия.
Уровень исследования фиксирует административную информацию, а уровни сеансов и серий - оценку моделей и сеансов МРТ. Объектная модель NIDM-оценки представляет собой общую модель для описания словаря данных и полученных оценочных данных. Используя модель NIDM- Assessment, оценка "Структура данных" состоит из отдельных "Элементов данных", соответствующих вопросам оценки. Когда вопрос оценки содержит несколько вариантов ответа, он кодируется как "ValueSet" в NIDM- Assessment, и документирует варианты ответа и их закодированные значения. Собранные для конкретной оценки данные хранятся в виде объектов оценки, описанных в соответствующем разделе "Структура данных". Эти объекты связаны с деятельностью по сбору данных, обнаруженной на уровне сеанса или серии модели NIDM-эксперимента, в зависимости от того, когда проводилась оценка. Представления по оценке NIDM выпускаются сериями с использованием Terse RDF Triple Language и опрашиваются с помощью SPAQRL.
Результаты
Модели NIDM-Experiment и NIDM-Assessment активно разрабатываются и в настоящее время оцениваются путем картирования различных наборов данных (например, FBIRN, OpenfMRI, NCANDA и т.д.) в эти структуры.
Центр Conte по изучению мозга при детских и подростковых патологиях в Университете Калифорнии в Ирвине использовал ранние модели, связанные с NIDM-экспериментом при создании своего информационного ресурса, который предоставляет исследователям межпроектные данные, включая модели частоты сердечных сокращений, движения плода, уровень кислорода в материнской крови, результаты измерений ДТИ и ФМРТ, а также графики связности мозга. Первые эксперименты показали, что эта модель является гибкой и применимой к широкому спектру разнородных типов данных.
Заключение
NIDM Experiment поддерживает различные варианты использования, направленные на представление первичных и производных данных, с целью упрощения обмена, интеграции и совместного использования этими данными. Предварительные результаты показывают, что подход, основанный на использовании W3C PROV-DM и NIDM, подходит для моделирования гетерогенных данных, часто собираемых в ходе нейровизуальных исследований, и демонстрирует преимущества использования методов семантической сети для аннотации данных. Продолжится работа по доработке модели NIDM -эксперимента и созданию приложений для оказания помощи исследователям в преобразовании имеющихся у них данных в формат представления NIDM -эксперимента и использовании этих данных в аналитических средствах и приложениях для управления информацией.