Плотный поток научных статей.
Было дело отмечал на канале, что многовато стало выпускаться научных статей в последнее время. С каждым годом датасет, собранный из всех аккумулированных человеческих знаний, увеличивается, что приводит к гигантскому размеру опубликованных данных. В них крайне тяжело разобраться, по крайней мере автору этих строк уж точно. Возникают вопросы, связанные с валидацией и доверием. Ведь любой новый укладываемый кирпичик требует упоминания всех предшествующих, на которых строится башня науки.
Эффект научного роста уже сам стал предметом изучения. Выходят статьи, в которых математически описываются данные, собранные с различных платформ типа WoS или Scopus. Пишутся статьи про то, что в мире пишут еще больше статей с каждым годом.
«А че так многа?»
Число публикаций растет, но становится ли больше знание? Надо аккуратно подойти к такому вопросу.
Я подумал, неплохо будет как следует забуриться в эту тему, чтобы поискать инфу о возможных причинах, которые обуславливают ускоренную печать научных трудов. Хотя, вроде бы все довольно очевидно. Экономический рост тянет за собой рост числа научных трудов. Но, тут как в вопросе, который не имеет правильного ответа про яйцо и курицу.
[UPD: внимательный читатель меня поправил. "Яйца были задолго до куриц у всякой живности, типо крокодилов, рептилий и что там ещё ползало до птиц. Так что как минимум, уже в наше просвещенное постпанковское время надо писать "Что появилось раньше - курица или куриное яйцо?" Но даже в этом случае все равно яйцо, потому что яйцо, из которого появилась первая курица, было снесено не курицей, а является следствием генетической мутации эмбриона, из которого получилась курица"]
Может и прорывы в науке тянут за собой экономический рост. Не так уж все просто.
Нырнул в вышеприведённый манускрипт, нашел там применение различных математических моделей, сравнение роста публикаций с экономическим ростом, вроде все логично. Но здесь я не буду рассказывать о функциях, которые исследователи использовали для описания стат. данных, собранных с различных баз. Поговорим о причинах. Или попытаемся про них, что-то узнать.
В разделе «Обсуждение результатов» можно увидеть следующее объяснение:
Мотивация для исследователей публиковать их результаты (в журнальных статьях) особенно повышается специфичностью научной системы вознаграждения: «Публикации так же имеют другую функцию [помимо отрытого доступа результатов исследований]: Принципиальным способом для ученых быть вознагражденными за их вклад в развитие знаний является узнаваемость со стороны коллег. Для того, чтобы получить такую награду, ученые публикуют свои исследования {прим. желательно в открытом доступе}, чтобы это могло быть использовано и признано их коллегами.
Такая мотивация существует. Я уже как-то писал, что наука похожа на шоубизнес, где все гонятся за охватами и признанием. Глупо отрицать, что многие ученые к этому стремятся, тем более, сам дизайн системы этого требует. Индексы цитируемости, количество опубликованных работ, качество и рейтинги журналов — все это нормально так влияет на мировую науку. Следует также отметить, что желание как можно сильнее увеличить охваты делает журналы с открытым доступом (Open Access) приоритетными, так как статьи, опубликованные в таких журналах, не будут сокрыты пейволлом. Но тогда, платить за публикацию будет необходимо самому ресерчеру из личных или проектных средств, либо средств организации, либо еще как-то, способов масса. Это уже бизнес, но не будем забегать вперед.
Кстати, в статье рассматривается еще одна интерпретация научного роста — рост количества самих ученых и их коллабораций:
Для объяснения скоростей научного роста, которые в большинстве своем увеличивались в период исторического развития, две интерпретации возможны:
Либо исследователи были в состоянии публиковать больше публикаций в одно и то же время или увеличившееся число публикаций может быть связано с увеличением числа исследователей.
Исследование Фанелли и Ларивьер {прим. извините, если неправильно перевел} отвечают на этот вопрос. Их результаты показывают, что второе объяснение является более предпочтительным. Фанелли и Ларивьер проанализировали 40 тыс. индивидуальных научных профилей, в которых первая работа появилась в базе данных Web of Science между 1900 и 1998 годами, и те, кто опубликовал две или более работ за первые 15 лет активности — в «ранней научной карьере» — фазе, в которой давление на ученого с целью опубликоваться рассматривается, как высокое. Как ожидалось, полное число работ, опубликованных учеными, увеличилось, особенно за недавние десятилетия. Однако, среднее число коллабораций так же возросло, и этот фактор должен быть принят во внимание, когда оцениваются публикационный рост. Скорректированные с учетом соавторства, скорости роста публикаций ученых во всех дисциплинах не увеличились в целом, а на самом деле в большинстве своем уменьшились.
Мои коллеги наверняка могут подтвердить, что современная научная статья часто будет качественно укомплектована соавторами из разных лабораторий и не только лабораторий внутри одной организации, но и соавторами могут быть сотрудники различных институтов. Поэтому появляется еще и проблема определения личного вклада конкретного соавтора.
Уместно привести часть отличного комментария из тг:
«Может директор собственноручно пишет больше тебя статей?»
Конечно же нет, но в соавторстве он будет, такова жизнь. По моему скромному мнению, основную работу делают двое, реже трое, остальные 10-20 человек идут прицепом.
Теперь перейдем к осознанию ограничений и проблем, связанных с интерпретацией результатов в такого рада работах, в которых изучается количество знаний. Надо отдать должное авторам, они отметили такие ограничения как:
Первое ограничение относится к использованию количества публикаций для оценки процесса роста. Существуют плюсы и минусы в использовании этих чисел: {имеется в виду число публикаций и другая статистика}
Хотя подсчет публикаций легок и относительно прямолинеен, интерпретация этих данных может создавать трудности, которые в прошлом привели к серьезной критике библиометрического подхода… Главные проблемы касаются таких вещей, как least publishable unit (LPU), {прим. минимальное количество информации, которое будет достаточно для написания публикации в рецензируемом журнале}, дисциплинарные различия, различия в качестве работ и различия в качестве журналов»
Второе ограничение связано с интерпретацией «роста», как «увеличения в количестве». Согласно Борнманну и Мутцу (2015), неясно, связано ли «увеличение численности публикаций» напрямую с «увеличением объема самих знаний».
Ну это тех знаний, которые реально можно использовать во благо (ну или как пойдет) человечества. Вот и выходит, что публикаций много, и каждый год их все больше, но есть ли смысл в таком ускорении? Я имею в виду смысл в повышении публикационных темпов. Сложный вопрос, требует непростого ответа.
Предлагаю перейти к самому сладкому, к тому, о чем пока что не было сказано.
К баблу.
Вот я взял и прокрутил статью в самый низ. Мои коллеги, возможно, уже начинают улыбаться в этот момент. Там внизу статьи, даже той, которая изучала библиометрические данные, есть такой раздел, он называется — Funding.
Там обычно не много текста. В работе, которую я разбираю написана одна строка:
«Open Access funding enabled and organized by Projekt DEAL»
Сейчас расскажу о внутренней кухне. Вряд ли читатель вообще о таком знает. Существует такой консорциум, который обеспечивает публикацию в открытом доступе в самых жирных изданиях (Elsevier, Springer Nature, Wiley). Если ученый связан с DEAL, то ему можно получить gold open access чисто за счет этого консорциума. Для этого ваша организация, в которой вы аффилированы должна быть участником в так называемом «Deal agreement» Это немецкая организация, которая таким образом борется за «своих пацанов» своих работников, чтобы те получали открытый доступ для свежих статей, которые они недавно опубликовали.
Публикация статей — это бизнес. Упрощенно есть два пути, чтобы журнал мог зарабатывать деньги.
Первый — публикация трудов, которые будут сокрыты подпиской на журнал, обычно оплачиваемой крупными институтами.
Второй — взимание Article Processing Charges (APCs) или OA fees для публикации в изданиях с открытым доступом, чтобы любой мог зайти на сайт издательства и прочитать вашу работу.
Дак вот, эта немецкая организация, по-видимому, имеет фондирование и всевозможные договоренности с крупнейшими издательствами по всему миру.
Deal устанавливает новые принципы для взаимоотношений между Немецким ученым сообществом и академическими издательствами. Основанный на понимании того, что денег, глобально платящихся за подписки, больше, чем достаточно, чтобы покрыть публикации с открытым доступом для современных научных журналов, цель договоренностей {прим. Имеется в виду с издательствами} трансформировать бизнес-модель, лежащую в основе публикации научных журналов, перейдя от модели, основанной на платной подписке, к другой модели, основанной на услугах публикации в открытом доступе.
По слухам, которые мне известны, у этой организации довольно много неприятелей по всему миру, так как она воткнулась большой занозой в задницу крупных издательств. Ведь подписочная модель приносит куда больше денег. Также DEAL получила в свой адрес кучу критики за то, что мелкие издания будут еще меньше получать статей в публикацию, так как крупняк будет жадно есть манускрипты, которые находятся под покровительством DEAl. Ну… так бывает.
Понятно, что консорциум заявляет о том, что они в своем фирменном стиле бойкотируют подписочные бизнес-модели больших научных журналов, сражаются за транспарентность и доступность научных знаний и все такое. На сайте выложены инвективы в сторону издательств, которые со слов консорциума задирают цены на подписки и вообще они плохие, люди не могут публиковать, не могут читать, все плохо. На рынке сложилась олигополия из крупных издательств, они всех держат за причинное место.
Забавно, что олигополия — это плохо, но договоренности и основной поток поддерживаемых публикаций все равно с Elsevier, Springer Nature и Wiley.
Дак вот, я немного отвлекся, но суть ясна, без денег сейчас сложно что-то опубликовывать и читать, если ты конечно же не ломаешь пейволл (осуждаем сильно сильно).
Забавно, что автор в свое время в 2021 году также был проспонсирован немецкой организацией, заплатившей за открытый доступ в PRB. В опубликованной статье в соавторах было много немцев. Данке-Мерси. Погнали дальше.
Я уже отметил несколько причин, ставших серьезными факторами, заставляющими ученых активно публиковаться. Хоть в научных статьях такое встретишь редко, но у меня есть гипотеза, что фандинг тоже сыграл довольно большую роль в том, что научных работ выходит очень много.
Повторюсь, это не железобетонное доказательство, а лишь гипотеза. Как хорошо, что в рамках моего проекта я не скован душной академичностью и могу многое себе позволить.
Читатель сам может проверить. Подавляющее большинство научных работ (статей, конференц пейперов, патентов и прочего) выходит с обязательным указанием спонсора. Тут какое дело, иногда спонсор и его деньги — это единственная причина, по которой вообще статья появилась на свет. Таковы текущие правила в науке.
Перейдем непосредственно к нашим реалиям.
Желающих освоить бюджет проекта, как правило, много и некоторые гранты предполагают коллаборации с другими институтами, находящимися в другом субъекте федерации. Существуют проекты РНФ, выдвигающие такое требование, как одно из основных. Есть мультидисциплинарные проекты, в которых комплектуется большая и разнородная команда. Годовая отчетность по завершению таких грантов волнующая. Эффективность таких движух лично у меня вызывает множество вопросов, но это мое мнение, не претендую на истину. В России, когда проект закончен по нему надо отчитаться и отчет будет чувствительно объемным.
Обычно исполнителей набивается несколько десятков, еще и со всей страны. Вот вам еще одна причина роста, как числа самих публикаций, так и количества соавторов. Поработали все (хотя, это спорно, конечно), значит в статьи, условно, включаем всех.
И это работает не только в России. Схожая система существует и в США. Я не поленился и нашел аналог, если так можно сравнивать, нашего РНФ, только за океаном. Ведь надо ориентироваться на Best Practices.
Представляю вашему вниманию следующий документ. Это, по сути, проектная документация, представленная на сайте US National Science Foundation, где описаны правила подачи заявки, администрирование проекта, оплаты, сроков, разрешение конфликтов и отчета по его завершению. Документ объемный, ровно такие же можно найти и в Российских фондах.
Я, как тот, кто имеет небольшой опыт взаимодействия с такими документами, сразу долистал до пункта «Администрирование наград» и далее до «Годовой и годовой финальный отчеты»
Меня очень интересовал вопрос, а как обстоит дело с отчетностью в US, ведь эта ужасно утомительная процедура немножечко бесит всех ученых. Есть ли там требования к предоставлению промежуточных годовых и окончательных отчетов в конце отчетного периода?
Ох, я многое нашел, мы даже отстаем от наших «коллег» по уровню бумажной работы. Бюрократии там тоже хватает. Мне было также интересно, есть ли пункт по завершению проекта, регламентирующий точное количество выпущенных статей и патентов? Просидев всю ночь, найти конкретного числа мне не удалось. А вот у нас такие требования выставляются. Например, нужно обязательно опубликовать n-ое количество ресерч пейперов в определенный период. Своего рода KPI, который определяется перед получением гранта.
В Америке такого нет, но рано радоваться. Из того, что мне удалось узнать, стало понятно то, что публикации у них — это вещь сама собой разумеющаяся. Их должно быть столько, сколько надо. Более того, сами проекты закладывают бюджет таким образом, чтобы из проектных денег производить оплату публикаций в открытый доступ. Классический подход. Круг замкнулся. Если комиссия решит, что «чето вы как-то хреново отработали», то даже этого будет достаточно, чтобы потом дать денег другим группам, которые справились лучше.
Все в лучших традициях, если проект рассчитан на 3 года, то каждый год по отчету и в конце финальный отчет, который не кумулятивный. Результаты включают: достижения и продукты. Требуют прямо результат дать. Я поискал и нашел информацию, что надо довести проект до состояния, чтобы можно было еще кому-то продать плоды вашего творчества. Поэтому радуемся, что у нас формальное и легчайшее требование, выраженное в количестве публикаций.
Более того, в US надо написать еще и специальный отчет, рассчитанный на широкую публику, который будет понятен обывателю. Требований целая гора и все они душные.
У нас дело может ограничится письменной заявкой, а там обязательный питч. Уровень конкуренции выше, людей в системе гораздо больше. Финансовая отчетность тоже веселая. В общем и целом, нам есть куда стремиться.
Итак, как же можно еще объяснить этот экспоненциальный рост числа научных статей? Пожалуй, один из важнейших факторов, оказавших огромное влияние на ускорение темпов печати, можно сформулировать следующим образом:
Публикация статей — это бизнес.
Да, этот тезис идет рука об руку с ростом ВВП, просто он немного конкретнее. Ведь такие понятия, как рост и бизнес часто встречаются вместе. Помимо базовых функций, присущих бизнесу: производство товаров и услуг (в идеале полезных и качественных, но так, к сожалению, бывает не всегда) и зарабатыванию денег, бизнесу часто необходимо расти и конкурировать, откусывая у соперников часть рынка.
Если публикационный темп снизится, то это замедление вряд ли сильно понравится издательствам, да и государствам тоже, так как эта индустрия неплохо интегрирована в научную систему и приносит в бюджет какую-то часть налогов. Я допускаю, что, если проектов станет меньше, значит публикаций станет меньше, скорее всего это скажется и на прибыли издательств. Из той открытой информации, которую мы сейчас имеем на столе, никто из крупных стран не жаждет переохладить экономику, значит и торможения научного принтера ждать не стоит. Наоборот, слышны заявления о том, что экономику будут сильно стимулировать. Денежным принтером.
Большой ли рынок?
Я порылся, нашел более-менее свежие данные. Компания Wiley (NYSE: WLY), в 3-ем квартале 2025ого года выручка 416 млн. долларов. Данные по выручке за 2025 год ~ 1,6 млрд. долларов. Доля сегмента «Research» в выручке самая большая ~1 млрд. EBITDA в районе 400 млн. долларов. И это только одно известное научное издательство. Рынок многомиллиардный.
По-моему, наука сегодня — это увесистый бизнес. И все, что характерно для бизнеса успешно перекочевало в академическую среду со всеми последствиями. Я не берусь ответить на вопрос, хорошо ли это или плохо. Сегодня такие правила: KPI, планы, роадмапы, отчеты и прочие радости. Обязательно нужен результат, ведь проект должен обеспечить какой-никакой возврат на инвестиции. И это правильно, так и должно происходить в бизнесе, иначе вообще, для чего он нужен?
Существует гипотеза, что в таком переформатировании науки огромную роль сыграли США, запустив череду мегапроектов условно после 40х годов в 20-м. веке. Кажется, что ранее (условно до 20ого века) наука была несколько другой, с иным порогом входа и приоритетами. Про то, как резко перекроили академическую систему, и какие решения привели к текущему виду научной индустрии, напишу в другом большом исследовании. Тема очень объемная и дискуссионная, можно долго размышлять о том, почему получилось так, и из-за чего получилось сяк. На сегодня будем закругляться.
С уважением,