Добавить в корзинуПозвонить
Найти в Дзене
Texnology

Dataset Search - поисковая система Google для научных данных

Благодаря новому поисковому поиску Dataset Search Google хочет облегчить доступ к базам данных с открытым исходным кодом. Похвальный подход, но на данный момент все еще очень неполный. После Новостей Google, Google Карт или Google Книги Google решает большие данные с запуском в среду, 5 сентября, новой поисковой системы под названием Dataset Search. Он предназначен главным образом для ученых и журналисов, он индексирует базы данных с открытым исходным кодом с публичных сайтов, университетов или организаций, таких как НАСА или французский сайт data.gouv.fr. Таким образом, мы можем найти секвенирование ДНК белка, сбор фотографий, сделанных роботом с Марса или исторические записи температуры поверхности океана. Для каждого результата Google Dataset Search отображает подробное описание набора данных с производителем, лицензией, форматом и сводкой содержимого. Цель Google - сделать научные данные «доступными как рецепты приготовления пищи, предложения о работе ...» . В качестве первого

Благодаря новому поисковому поиску Dataset Search Google хочет облегчить доступ к базам данных с открытым исходным кодом. Похвальный подход, но на данный момент все еще очень неполный.

После Новостей Google, Google Карт или Google Книги Google решает большие данные с запуском в среду, 5 сентября, новой поисковой системы под названием Dataset Search. Он предназначен главным образом для ученых и журналисов, он индексирует базы данных с открытым исходным кодом с публичных сайтов, университетов или организаций, таких как НАСА или французский сайт data.gouv.fr. Таким образом, мы можем найти секвенирование ДНК белка, сбор фотографий, сделанных роботом с Марса или исторические записи температуры поверхности океана. Для каждого результата Google Dataset Search отображает подробное описание набора данных с производителем, лицензией, форматом и сводкой содержимого.

Цель Google - сделать научные данные «доступными как рецепты приготовления пищи, предложения о работе ...» . В качестве первого шага Google будет в основном перечислять данные об окружающей среде, социальных науках и общественных услугах. Это является частью общего стремления Google упростить доступ к научным данным. В 2004 году он запустил Google Scholar, поисковую систему, в которой перечислены научные публикации (статьи, книги, тезисы ...).

Поиск Google Dataset. © Google
Поиск Google Dataset. © Google

Результаты на данный момент очень ограничены

Но на данный момент поисковая система по-прежнему кажется очень неполной. Ввод «глобального потепления » дает едва дюжину результатов, например, с помощью глобальных температурных сценариев правительства Канады или снега в Верхней Савойе (данные, опубликованные Ведомственным управлением Haute-Savoie). Единственным документом, в котором упоминается Giec, является пустой набор данных.

С одной стороны, большинство производителей индексированных данных являются американскими. С другой стороны, Dataset Search не сканирует содержимое данных как классическую веб-страницу или книгу, а опирается на метаданные, предоставленные производителями. Чтобы быть доступным, набор данных должен быть проиндексирован в соответствии со стандартизованным методом schema.org, разработанным основными поисковыми системами (Google, Bing, Yahoo и Yandex). Чтобы улучшить SEO, Google поощряет всех производителей данных соблюдать этот стандарт, который не должен задерживаться, поскольку доминирование Google в Интернете, в том числе научное, является сильным.