Масштабный рост глобальной исследовательской деятельности в последние годы подстегнул исследования того, насколько продуктивным было это расширение и каким может быть будущее. Хотя творчество и удачу отдельных открытий будет по-прежнему трудно смоделировать, количественные исследования выявили закономерности в темпах открытия и опубликованных результатов с течением времени.
Некоторые из этих исследований показывают, что инновации сокращаются, что отражает объем производства научного предприятия, чья система факторов производства способствовала проведению исследований, ориентированных на получение "низко висящих плодов". Параллельно с этим спадом наблюдался недавний глобальный экономический спад, который потребовал от государственных вложений в научные разработки отчитываться за результаты социально-экономической деятельности.
В настоящее время существует большой спрос на понимание того, как работает система науки.
Одной из новых областей, представляющих интерес для исследований в области "науки о науке", является прогнозирование будущего воздействия. Это является логическим продолжением оценки исследовательских грантов, выдачи научных стипендий и определения заработной платы преподавателей, а также других решений. По мере совершенствования прогнозов они будут играть все большую роль в принятии решений о том, какие области государственного и частного капитала будут использоваться для исследований, разработок и производства.
Но как можно предсказывать будущее? Ряд недавних исследований помогли лучше осмыслить факторы, действующие на будущие ссылки на статью или исследователя. Например, цитаты накапливаются в статьях, размещенных в научных журналах в течение определенного времени в соответствии с хорошо отлаженным лог-нормальным распространением, с увеличением числа цитат в момент публикации, за которым следует постепенный упадок.
Существует также сильное преимущество "первопроходца" в получении цитат, т.е. ранняя посредственная статья по теме часто получает больше цитат, чем поздняя превосходная статья. Существуют и другие факторы, которые предсказывают ссылки на полное творчество ученого, такие как тематическое разнообразие журналов, в которых публиковались первые статьи ученого. Исследователи продвигают эти усилия, интегрируя три ключевые характеристики в генеративную модель долгосрочного воздействия статьи: преференциальную привязанность, временную тенденцию цитирования и лежащую в основе работы "пригодность". Их модель ссылается на предыдущие модели того, что объясняет популярность веб-сайтов [преференциальная привязанность, с которой другие веб-сайты ссылаются на нее, и "качество" контента веб-сайтов, отраженное в его полезности для пользователей Интернета] и лог-нормальная вероятность, с которой возрастает влияние статьи, со временем снижается.
Авторы объединили эти элементы в трехпараметрическую модель с рядом четких, производных и поддающихся эмпирической оценке количеств, связанных с отдельной статьей.
К ним относятся относительная пригодность статьи (ее важность по сравнению с аналогами), оперативность (время, необходимое для достижения пика цитирования), долговечность (скорость распада цитирования), время воздействия (характерное время для привлечения большей части цитируемых материалов) и конечное воздействие (цитирование, которое она получит за время своего существования, которое зависит только от ее относительной пригодности). Полученная модель использовалась для прогнозирования последующих цитат на основе ранних моделей. Учитывая эти различные особенности, все ненулевые траектории цитирования следовали по одному и тому же пути. Кроме того, авторы обобщают модель до уровня журналов (как это возможно для исследователей, факультетов, университетов, стран или научной системы в целом), чтобы объяснить, как недавнее падение относительного влияния известного журнала может быть объяснено только увеличением времени воздействия, связанного с его статьями.
Раннее описанная модель также не идеальна. Ее оценка будущего улучшается с увеличением количества прошлых данных. Более того, цитирование представляет собой лишь один аспект воздействия, потому что не академические специалисты-практики могут находиться под влиянием статьи, но не могут ее цитировать. Тем не менее, модель объединяет ряд важных факторов для прогнозирования будущего успеха цитирования. Успех этой и других моделей, основанных на ней, ставит вопрос о том, как предсказание успеха той или иной статьи может изменить науку. Широкомасштабное, последовательное прогнозирование будущего воздействия идеи обязательно ускорит решение вопроса о том, какие идеи победят, а какие проиграют в конкуренции за внимание и ресурсы.
Поскольку мы не можем знать все о будущем, зная лишь импульс восприятия статьи, мы можем действовать как самореализующееся пророчество, поэтому ученые могут преждевременно отказаться от идей, которые еще могут иметь второй или третий эффект. Ученые признают, что их модель не могла предсказать будущие цитаты из фундаментальной работы. Способность лучше предсказывать успех статьи может привести к более быстрому научному жизненному циклу открытия - от момента публикации до широкого признания. Это могло бы затем привести к более быстрой конвергенции в передовую практику, что позволило бы увеличить число ученых, обладающих навыками, необходимыми для использования результатов эффективных открытий.
Однако это может произойти только потому, что быстрый наплыв новых идей усилит конкуренцию за последующие исследования и публикации, поскольку большая часть ученых идет по одному и тому же пути. Однако эти предостережения не применимы ко всем тем случаям, когда предсказание более удачного воздействия предвещает успех.
Способность автоматически извлекать научные утверждения из исследовательских статей и анализировать их содержание должна привести к прогнозированию или вычислительной генерации новых многообещающих гипотез.
Она, вероятно, также подвергнет проверке и прямой оценке распространенные предположения и практику науки.
Таким образом, прогнозирование цитирования представляет собой один из шагов на пути к созданию более творческих, рискованных, настойчивых и широко читаемых алгоритмических или роботизированных "ученых", чем мы сами. Позволяя ученым рассматривать не только наиболее плодотворные гипотезы, но и наиболее эффективные алгоритмы их формулирования, методы прогнозирования будущего расширят научные возможности, повысят продуктивность и отдачу от науки для общества.