Найти в Дзене

Датасеты в наукометрии как источники информации о публикациях полезны все всех: от начинающих исследователей до нобелевских лауреатов

Данные об авторах можно разделить на две части: собранные на основе публикаций и имеющие другое происхождение, прежде всего – ORCID, где ученые регистрируются лично или с помощью работодателей. Профили на основе публикаций для всех проиндексированных авторов доступны в датасетах OpenAlex (обогащет авторов наиболее важными тематиками и фиксирует последнее место работы), FATCAT и Semantic Scholar (приводит индекс Хирша), а также DBLP. Существует также большой датасет авторов на основе OpenAlex, созданный для развития Author Name Recognition, т.е. надежного автоматизированного соотнесения записей об авторах с самими авторами. Он подготовлен представителями Китая, для которых эта задача особенно актуальна. Канонический каталог авторов – ORCID, включающий всю информацию, которую авторы там разместили в режиме public. Из традиционных коммерческих баз следует отметить перечень метрик цитируемости для 200 тысяч наиболее цитируемых авторов Scopus, но он не содержит ни авторских идентификаторов,

Данные об авторах можно разделить на две части: собранные на основе публикаций и имеющие другое происхождение, прежде всего – ORCID, где ученые регистрируются лично или с помощью работодателей.

Профили на основе публикаций для всех проиндексированных авторов доступны в датасетах OpenAlex (обогащет авторов наиболее важными тематиками и фиксирует последнее место работы), FATCAT и Semantic Scholar (приводит индекс Хирша), а также DBLP. Существует также большой датасет авторов на основе OpenAlex, созданный для развития Author Name Recognition, т.е. надежного автоматизированного соотнесения записей об авторах с самими авторами. Он подготовлен представителями Китая, для которых эта задача особенно актуальна. Канонический каталог авторов – ORCID, включающий всю информацию, которую авторы там разместили в режиме public.

Из традиционных коммерческих баз следует отметить перечень метрик цитируемости для 200 тысяч наиболее цитируемых авторов Scopus, но он не содержит ни авторских идентификаторов, ни связок с публикациями. По отдельным категориям авторов – например, нобелевским лауреатам – есть очень богатые датасеты со списками всевозможных публикаций.

Авторское фото волгоградского ученого и фотографа Елены Попковой: https://www.saatchiart.com/account/artworks/1599809
Авторское фото волгоградского ученого и фотографа Елены Попковой: https://www.saatchiart.com/account/artworks/1599809

В этом посте использован материал: http://sciguide.hse.ru/sources/datasets/

#инк #научныекоммуникации #наукароссии #ученые #консорциумустойчивогоразвитияитехнологическоголидерства #датасеты #экономикаданных #наукометрия