Найти в Дзене

Презентация публикаций по открытой науке

Представляем вашему вниманию интересное исследование Гарева К.В. "Определение принципов проектирования отечественной платформы обмена научными датасетами". 2025. Т. 38. № 1. С. 122–133. URL: https://elibrary.ru/item.asp?id=80597488 ▎Актуальность и цели исследования В международном научном сообществе постепенно укрепляется и развивается
концепция Open Science, призванная обеспечить более широкое и открытое распространение научных данных, результатов исследований и методологических наработок. Европейская комиссия подчеркивает, что открытое взаимодействие в научно-исследовательской среде стимулирует инновации и экономический рост, а также способствует решению крупных социально-экономических задач. В свою очередь, Организация экономического сотрудничества и развития (OECD) отмечает, что доступность и повторное использование исследовательской информации являются важнейшими условиями повышения эффективности научного сотрудничества и ускорения научно-технического прогресса. Неотъемлемой сост

Представляем вашему вниманию интересное исследование Гарева К.В. "Определение принципов проектирования отечественной платформы обмена научными датасетами". 2025. Т. 38. № 1. С. 122–133. URL: https://elibrary.ru/item.asp?id=80597488

Актуальность и цели исследования

В международном научном сообществе постепенно укрепляется и развивается
концепция Open Science, призванная обеспечить более широкое и открытое распространение научных данных, результатов исследований и методологических наработок. Европейская комиссия подчеркивает, что открытое взаимодействие в научно-исследовательской среде стимулирует инновации и экономический рост, а также способствует решению крупных социально-экономических задач. В свою очередь, Организация экономического сотрудничества и развития (OECD) отмечает, что доступность и повторное использование исследовательской информации являются важнейшими условиями повышения эффективности научного сотрудничества и ускорения научно-технического прогресса.

Неотъемлемой составляющей современных подходов к организации научных данных является концепция FAIR-принципов (Findable, Accessible, Interoperable, Reusable). Ее авторы акцентируют внимание на необходимости обеспечения удобного поиска, доступности, совместимости и возможности повторного использования данных в широком спектре научных дисциплин, что должно способствовать повышению эффективности обмена научными данными
и прозрачности процесса получения исследовательских результатов.

Вышеупомянутые принципы реализуются путем создания различных цифровых инфраструктур, в том числе международных научных датахабов.

В России данное направление находится в стадии формирования: несмотря на появление отечественных баз научных данных, до последнего времени отсутствовал системный подход к созданию универсальных платформ для обмена научными датасетами. Новая стратегия научно-технологического развития Российской Федерации декларирует необходимость разработки и внедрения таких платформ, указывая на их потенциальную значимость для обеспечения технологической независимости и повышения глобальной конкурентоспособности отечественных научных организаций.

Данная статья посвящена рассмотрению существующих инициатив и подходов в области создания научных датахабов и возможных направлений их создания и развития.

Анализ зарубежного опыта построения и использования систем управления научными данными

  • EUDAT – крупномасштабная европейская инфраструктура, предназначенная для управления научными данными и предоставления исследовательским сообществам инструментов для хранения, обработки и обмена данными. Ее основная цель заключается в создании единой унифицированной платформы для обеспечения FAIR-принципов и поддержки междисциплинарных исследований.
  • EOSC – инициатива Европейской комиссии, направленная на создание федеративной и открытой мультидисциплинарной среды, где европейские исследователи, инновационные компании и граждане могут
    публиковать, находить и повторно использовать данные, инструменты и сервисы для научных, инновационных и образовательных целей.
  • DataONE – сеть репозиториев данных, призванная сохранять и предоставлять доступ к данным в области наук о Земле и окружающей среде.
  • Dryad – международный открытый репозиторий, предоставляющий исследователям платформу для публикации и сохранения данных, лежащих в основе научных и медицинских публикаций.
  • Zenodo – универсальный открытый репозиторий, разрабатываемый в рамках программы OpenAIRE и управляемый CERN, предоставляет исследователям возможности по хранению и распространению статей, наборов данных, ПО и других цифровых объектов.

Рассмотренные международные платформы демонстрируют ряд общих принципов.

Во-первых, каждая из них делает ставку на использование устойчивых идентификаторов для обеспечения цитируемости и глобальной прослеживаемости данных (DOI, Handle), что упрощает их поиск и интеграцию.

Во-вторых, ключевым аспектом во всех системах выступает работа с качественными и стандартизированными метаданными (Dublin Core, Schema.org и др.), обеспечивающими высокую интероперабельность между различными областями исследований.

В-третьих, данные платформы ориентированы на соблюдение принципов FAIR.

Таким образом, совокупность этих характеристик закладывает основу для эффективного функционирования датахабов.

Отечественные решения для работы с научными данными

В России отсутствуют централизованные датахабы, аналогичные зарубежным. При этом существуют репозитории научных данных, созданные отдельными институтами. Например, Институт космических исследований РАН предоставляет доступ к данным через Центр коллективного пользования «ИКИ-Мониторинг», который обеспечивает хранение и обработку спутниковых наблюдений для изучения и мониторинга окружающей среды.

Одним из примечательных является проект «Инфраструктура научно-исследовательских данных» (ИНИД), разработанный Центром перспективных управленческих решений. реализованный функционал позволяет рассматривать данную платформу как сервисную основу для развития отечественного междисциплинарного научного датахаба на базе Российского центра научной информации, являющегося текущим оператором ИНИД.

Иная ситуация с платформами, направленными на работу не с научными датасетами, а с научно-технической информацией, являющейся ключевым ресурсом для организации и управления научной и инновационной деятельностью. Она включает в себя сведения о научных исследованиях, технологических разработках, патентах, публикациях, конференциях и других
аспектах, отражающих динамику научно-технического прогресса.

  • Единая государственная информационная система учета результатов научно-исследовательских, опытно-конструкторских и технологических работ гражданского назначения – централизованная платформа для учета данных
    о научных исследованиях и разработках в России, охватывающая все этапы проекта от запуска до итоговых результатов.
  • Поисковая платформа Роспатента – цифровая система для доступа к патентной информации, позволяющая осуществлять поиск и анализ сведений об объектах интеллектуальной собственности (патенты, товарные знаки, полезные модели) по различным параметрам, включая текст, изображения и прочее.
  • eLIBRARY.RU – одна из крупнейших российских научных электронных библиотек с более чем 50 млн публикаций (статьи, монографии, диссертации, материалы конференций) и интеграцией с РИНЦ.

Анализ международного опыта в сфере создания и развития инфраструктуры научных датахабов, а также рассмотрение существующих российских систем работы с научно-технической информацией позволяют выявить ряд проблем.

Во-первых, неоднородность форматов и стандартов метаданных затрудняет интеграцию и обработку крупных и разнородных массивов данных, а недостаток специализированной инфраструктуры не обеспечивает на должном уровне хранение и анализ больших объемов информации.

Во-вторых, отсутствие единого подхода к интероперабельности и стандартам взаимодействия между различными платформами порождает сложности доступа к данным и их повторного использования.

В-третьих, проблемы воспроизводимости научных результатов, а также неоднородная стандартизация правил по формированию метаданных отрицательно сказываются на возможности воспроизводимости исследований.

Важно отметить, что российские информационные системы в большей степени ориентированы на учет результатов научной деятельности, публикационную активность и патентную статистику, тогда как готовых решений, специализирующихся именно на совместном использовании структурированных научных датасетов, на сегодняшний день существенно
меньше.

Общие принципы построения платформы обмена научными датасетами

Формирование единой междисциплинарной платформы для обмена научными датасетами в России предполагает комплексный подход, охватывающий несколько ключевых принципов:

  1. Создание и поддержка среды для обмена знаниями, совместных междисциплинарных исследований и обучения;
  2. Разработка четкой методологии, включающей регламенты описания и оценки качества датасетов, а также механизмов защиты интеллектуальных прав;
  3. Выбор и адаптация инструментов, позволяющих эффективно формировать, обрабатывать и распространять данные, включая решение задач по загрузке, выгрузке и визуализации.

Еще одним определяющим фактором становится организация самих данных – создание единого каталога с детальным классификатором и реализация FAIR-принципов доступности и совместимости.

Сообщество – это не только носитель культурных и научных традиций, но и движущая сила для непрерывного развития платформы обмена датасетами. Международные проекты показывают важность комплексной поддержки взаимодействия между учеными.

Следуя данному принципу, функционально необходимо реализовать:

  1. Тематические рабочие группы (виртуальные исследовательские сообщества); создание специализированных секторов внутри платформы, где ученые по смежным дисциплинам могут общаться, совместно формировать библиотеки рабочих инструментов, обсуждать кейсы и получать экспертизу от более опытных коллег;
  2. Форумы и систему «вопрос–ответ»; аналог Kaggle Discussions, где участники задают практические вопросы по обработке датасетов, обращаются за технической или методической поддержкой и получают обратную связь от
    членов сообщества с разным уровнем компетенций;
  3. Регулярные конкурсы и хакатоны; организация соревнований по анализу предоставленных датасетов в различных предметных областях;
  4. Инструменты для совместной работы; предоставление возможности вести коллективную разработку внутри платформы (совместное редактирование метаданных, настройка рабочих процессов для обработки данных и т.п.)
    с сохранением версионности и историй изменений.

Наличие методологии является фундаментальным принципом, определяющим структуру, стандарты и регламенты работы с данными в рамках платформы обмена научными датасетами. Международный опыт показывает, что
выстраивание четких методологических основ позволяет обеспечить прозрачность, воспроизводимость и высокое качество научных исследований.

Автор статьи обращает внимание, что при разработке методологической основы необходимо учесть несколько основных аспектов (регламенты описания датасетов, стандарты и процедуры оценки качества, порядок обмена научными данными и защита авторских прв, юридический и этический регламент). А также даёт рекомендации порядка наполнения платформы для эффективной работы каталога.

Заключение

Комплексное сочетание функциональных сервисов, регламентов взаимодействия и механизмов поддержки сообщества позволит сформировать полноценную экосистему открытой науки, способствующую повышению конкурентоспособности российской науки в глобальном пространстве. Автор утверждает, что внедрение описанных решений создаст условия для более
тесного междисциплинарного сотрудничества, простимулирует инновационную активность и обеспечит доступ исследовательских групп к данным, необходимым для проведения передовых исследований и технологических разработок.

-2