Данные об авторах можно разделить на две части: собранные на основе публикаций и имеющие другое происхождение, прежде всего – ORCID, где ученые регистрируются лично или с помощью работодателей. Профили на основе публикаций для всех проиндексированных авторов доступны в датасетах OpenAlex (обогащет авторов наиболее важными тематиками и фиксирует последнее место работы), FATCAT и Semantic Scholar (приводит индекс Хирша), а также DBLP. Существует также большой датасет авторов на основе OpenAlex, созданный для развития Author Name Recognition, т.е. надежного автоматизированного соотнесения записей об авторах с самими авторами. Он подготовлен представителями Китая, для которых эта задача особенно актуальна. Канонический каталог авторов – ORCID, включающий всю информацию, которую авторы там разместили в режиме public. Из традиционных коммерческих баз следует отметить перечень метрик цитируемости для 200 тысяч наиболее цитируемых авторов Scopus, но он не содержит ни авторских идентификаторов,
Датасеты в наукометрии как источники информации о публикациях полезны все всех: от начинающих исследователей до нобелевских лауреатов
3 февраля 20233 фев 2023
222
1 мин