ГЛАВА 1. ПОЧЕМУ ИСТОРИКУ НУЖНА ЦИФРОВАЯ ИСТОРИЯ: ОТ ПРОТИВОРЕЧИЙ К ФАКТАМ
1. Проблема, которая преследует историю на протяжении веков
Представьте сцену, знакомую каждому историку. Вы работаете с источниками о событии X века. Одна летопись говорит, что это произошло в 1045 году. Другая — в 1052 году. Третья вообще молчит. На одной карте место названо так, на другой — совсем иначе. Один документ говорит, что путь занял три месяца, другой — пять.
Традиционно историк поступал просто: объявил одну летопись «надёжной», другую — «сомнительной», выбрал удобную датировку и идёт дальше. Или ещё хуже — осуждает предыдущего исследователя за ошибку, сам выбирает другую дату и объявляет её истиной. Спор превращается в столкновение авторитетов: кто громче, кто известнее, кто принадлежит к влиятельной научной школе.
А что если всё по-другому?
Что если эти противоречия — не помехи и не ошибки, а информация, которую нужно обработать? Разница в пять лет между двумя летописями — это не просто неточность. Это наблюдение. Это говорит о чём-то. Может быть, об ошибке переписчика. Может быть, о редатировке. Может быть, о преднамеренной правке. Может быть, о двух разных событиях, которые позже слили в одно.
Вместо того чтобы отбрасывать противоречие, нужно его зафиксировать численно, поместить в контекст других свидетельств и спросить: при каких условиях разные источники говорили бы именно то, что они говорят? Какая гипотеза об истории объясняет все эти расхождения?
Это и есть цифровая история — не замена традиционной науке, а её инструмент, который превращает споры в вычисления.
2. Почему традиционный подход недостаточен
Историк всегда работает с неполными данными. Рукописей мало. Большинство текстов погибло. Монет найдено случайно. Документы повреждены, их прочтение сомнительно. И главное — источники противоречат друг другу.
Традиционно это рассматривалось как беда. Но в действительности это ресурс. Каждое противоречие — это окошко в процесс передачи информации, в ошибки переписчиков, в редакторские правки, в фальсификации и в объективные процессы исторического изменения.
Проблема № 1: непрозрачность решений.
Когда историк пишет монографию, он не показывает читателю, как он принял решения. Вот он прочитал фрагмент летописи. Он интерпретировал его так-то. Он решил, что это описание относится к конкретному событию. Но как он это решил? На основании чего? Какие альтернативные интерпретации он рассмотрел и почему отверг? Всё это скрыто. Монография показывает только конечный вывод.
Рецензент может оспорить вывод, но процедура уже проведена, и на самом деле спор идёт о том, кому больше верить, а не об объективном анализе.
Проблема № 2: асимметрия авторитета.
Канонические издания задают исходные истины. Национальные историографические традиции накладывают невидимые рамки. Авторитетные учёные могут позволить себе апелляцию к авторитету: «Компетентные историки согласны, что...» Новичку или исследователю из менее влиятельной школы труднее оспорить такое утверждение.
Проблема № 3: политизация.
Если данные разрежены и процедуры непрозрачны, историческое знание легко становится инструментом политики. Национализм, религиозная идеология, государственный заказ — всё может быть вписано в историографию под видом научного вывода.
3. Революция в источниках и инструментах
Произошло четыре перемены, которые сделали новый подход возможным:
Первая перемена: датофикация.
За последние два десятилетия огромное количество исторических источников оцифровано. Это не просто сканы. Это организованные базы данных с метаданными: датами, местами, авторами, языками, ссылками между документами. Теперь можно видеть все источники одновременно и все связи между ними. Раньше историк работал с выборкой — несколько книг, несколько документов. Теперь можно работать со всей совокупностью.
Вторая перемена: дешевизна вычислений.
Байесовские модели, графовые алгоритмы, симуляторы маршрутов — все это раньше требовало суперкомпьютеров и специальных центров. Теперь это работает на обычном ноутбуке. За секунды можно пересчитать сложную модель с новыми параметрами. Это изменило стимулы: исследователь может теперь варьировать допуски и видеть, как меняется результат. Не нужно выбирать одну версию — можно посмотреть всё спектр вариантов.
Третья перемена: стандарты воспроизводимости.
Возникла культура версионирования, контрольных сумм, фиксированных конфигураций. Если исследователь опубликует архив с данными, параметрами и кодом, другой исследователь сможет скачать всё, запустить на своём компьютере и получить идентичный результат. Если результат не воспроизводится, это техническая ошибка, которую нужно найти. Никакой магии, никаких чёрных ящиков.
Четвёртая перемена: мультидисциплинарность.
Методы из логистики, теории графов, теории решений, лингвистики, геоинформатики стали совместимы. Они используют единый язык — интервалы, вероятности, сети, метрики. Можно комбинировать их, проверять друг относительно друга, объединять результаты.
Это совпадение четырёх тенденций — вот что сделало цифровую историю наукой, а не просто статистикой.
4. Три метода: как они работают вместе
Представьте трёх экспертов, которые смотрят на один исторический вопрос с трёх разных углов. Каждый видит то, что другие упускают.
4.1. IA-Δ: интервальный анализ с контролируемым сдвигом
Что делает: Этот метод говорит: «Давайте остановимся и договоримся, в каких границах мы будем искать согласие».
Например, вы утверждаете, что событие A и событие B — это одно и то же. На каких основаниях?
- Даты совпадают? Но совпадают ли именно или приблизительно? На сколько лет можно ошибиться?
- Места совпадают? Но одна карта может быть неточной. Насколько далеко могут быть на самом деле эти места?
- Названия совпадают? Но названия варьировались. Какая степень различия всё ещё считается совпадением?
IA-Δ говорит: зафиксируем эти допуски. Скажем, даты могут различаться на ±20 лет, места — на ±50 километров, имена — не более чем на две редакции звучания. Вот такой прямоугольник в пространстве времени и места — это наше «допустимое окно».
Теперь, когда мы анализируем источники, мы видим: попадает ли каждое свидетельство в эту окно или нет? Если события A и B попадают вместе в одно окно при всех трёх параметрах — это кандидат на совпадение. Если не попадают — нужна другая гипотеза.
Почему это важно:
- Это останавливает произвол. Автор не может тайком растянуть хронологию на 100 лет, если он договорился о допуске ±20.
- Это делает спор техническим. Две школы могут не согласиться о размере допуска, но тогда они обсуждают конкретное число, а не философию.
- Это выявляет аномалии. Если одно свидетельство выпадает из окна, это флаг. Может быть, этот источник искажён. Может быть, это совсем другое событие.
4.2. BT-REI: байесовская триангуляция с источниковой трассировкой
Что делает: Этот метод говорит: «Теперь давайте посчитаем, насколько вероятна каждая гипотеза, учитывая все источники и их надёжность».
Вы собрали все источники по вашему вопросу: три летописи, два документа, карту, монету, археологическую находку. Какова вероятность того, что события A и B — одно и то же?
Не просто «вероятность», а рассчитанная на основе:
- Откуда каждый источник (канцелярский акт X века надёжнее, чем позднейшая компиляция);
- Что каждый источник говорит (источник 1 называет дату X, это +0,15 к вероятности; источник 2 говорит другую дату, это −0,10);
- Насколько источники зависимы друг от друга (если две летописи списаны с одного протографа, они не дают двойного подтверждения);
- Какие признаки поддерживают гипотезу, какие противоречат ей.
Почему это важно:
- Авторитет источника становится параметром, а не магией. Вместо того чтобы сказать «Иоанн Киевский — надёжный автор, верим ему», вы говорите: «Фиксируем его надёжность на 80% и смотрим, что получится. А что если она 70%? Или 90%?»
- Противоречия перестают быть катастрофой. Они учитываются в модели. Если один источник противоречит остальным, он получает штраф в правдоподобии, но не исключается полностью.
- Рецензент может пересчитать. Если он не согласен с вашей оценкой надёжности источника, он может запустить модель с иной оценкой и увидеть, как меняется результат.
4.3. S³-DELTA: сетевая консолидация и испытание на прочность
Что делает: Этот метод говорит: «Окей, у вас есть гипотеза с хорошим апостериором. Но насколько она хрупка? Что случится, если один источник окажется ненадёжным? Если один маршрут закроется? Если допуск окажется иным?»
Методы 1 и 2 дали вам единое объяснение фактов. Но объяснение держится на нескольких столпах. Какие столпы критичны? Какие из них можно убрать без ущерба?
S³-DELTA строит граф — сеть связей между событиями, местами, источниками. Потом удаляет из графа по одному источнику и смотрит, рушится ли гипотеза. Потом закрывает логистический коридор (допустим, зимний лёд блокирует реку) и смотрит, остаётся ли гипотеза жизнеспособной.
Почему это важно:
- Выявляет хрупкость. Если гипотеза держится на единственном свидетельстве, это видно. Такие гипотезы помечаются как ненадёжные.
- Находит узкие места. Иногда гипотеза прочна, но только потому, что один конкретный маршрут или один кластер источников критичны. Это видно и может быть проверено.
- Показывает альтернативы. Если гипотеза выдерживает стресс-тесты, это значит, что альтернативные маршруты её не опровергают. Если не выдерживает, значит есть мосты, по которым гипотеза может упасть.
5. Главная идея: противоречия — это не помехи, а данные
Нормальное историческое исследование столкнётся с противоречиями. Это неизбежно. Два источника говорят разные даты. Три карты показывают один топоним в разных местах. Три хроники дают разные версии одного события.
Старый подход: Выбрать одну версию, отклонить остальные. Объявить одну летопись надёжной, другую — ненадёжной. Спрятать противоречие под ковёр.
Новый подход: Зафиксировать каждое противоречие как наблюдение. Спросить: при каких условиях источники дали бы ровно эти противоречия? Что это говорит нам об истории?
Например:
- Если две летописи расходятся в датах ровно на 10 лет, это может означать: ошибку переписчика, систематический сдвиг в одной традиции, редатировку при переделке рукописи, или два разных события, которые позже слили.
- Если топоним на разных картах указан в разных местах, это может означать: неточность картографа, переименование места, передачу названия на новое место, или путаницу между двумя похожими местами.
Все эти гипотезы можно моделировать и проверять.
6. Какие источники используются
Система работает с разными типами свидетельств одновременно:
- Текстовые источники: летописи, хроники, папские буллы, географические сочинения, письма, грамоты, договоры.
- Картографические источники: оригинальные карты, современные реконструкции, карты разных авторов и эпох.
- Археологические находки: датировки объектов, их локализация, контексты.
- Нумизматика: монеты как свидетельства времени, места чеканки, властей.
- Ономастика и топонимия: названия людей, мест, народов и их варианты.
- Административные и церковные реестры: списки епископов, должностных лиц, территориальные деления.
Критическое требование: каждый источник организуется как отдельный слой с собственной системой описания. Летопись — это не просто текст, это набор датировок, мест, персоналий. Карта — это не просто картинка, это набор координат и топонимов. Каждый слой имеет свои правила нормализации (как приводить даты к единому виду, как кодировать места, как обозначать имена).
Главное требование: полная прослеживаемость. Любой итоговый вывод должен быть восстановим по цепочке:
исходные данные → принятые допуски → временно-пространственные выравнивания → вероятностные оценки → итоговый результат
Если вы посмотрели на финальный результат и возникнули вопросы, вы должны суметь проследить: откуда это взялось? Какие источники дали этот сигнал? На каких допусках это основано? Какие другие сценарии были рассмотрены?
7. Практический опыт: триангуляция через три канала
Практика показала, что для средневековой Европы особенно полезно работать параллельно с тремя независимыми каналами свидетельств:
- Папство: папские буллы, письма, реестры, решения синодов.
- Византия: византийские хроники, официальные документы, жития святых.
- Священная Римская империя: имперские дипломы, акты курфюрстов, хроники немецких монастырей.
Эти три канала часто независимы: они не ссылаются друг на друга, имеют разные традиции датирования, разные географические приоритеты. Если все три канала говорят одно и то же, это очень сильный сигнал. Если расходятся, можно искать причины расхождения.
8. Как система работает: пять этапов
Этап 1: подготовка данных.
Все слои приводятся к единому формату. Все даты нормализуются (юлианский, григорианский, византийский, исламский календари переводятся в единую опорную шкалу). Все места кодируются в единой системе координат. Все имена и названия проверяются на совпадения и варианты.
Этап 2: IA-Δ.
Строятся временные и пространственные окна согласия. Генерируются варианты выравнивания. Для каждого варианта фиксируется, какие допуски были использованы и какие источники в него попали.
Этап 3: BT-REI.
Для каждого варианта (гипотезы) вычисляется вероятность на основе источников и их надёжности. Результатом является ранжированный список гипотез с полным журналом того, какой источник дал какой вклад.
Этап 4: S³-DELTA.
Результаты объединяются в граф. Проводятся стресс-тесты: удаление источников, блокировки путей, варьирование допусков. Для каждой гипотезы вычисляются оценки устойчивости и риска.
Этап 5: выводы и отчётность.
Результаты оформляются в виде паспорта, который содержит всю информацию для независимой проверки: какие допуски использованы, какие источники, какие параметры, какие результаты, какие неопределённости.
9. Воспроизводимость: как это гарантируется
Вся система строится на принципе неизменяемого расширения. Каждое обновление создаёт новый выпуск архива, который сохраняет всю историю изменений. Ничего не удаляется, ничего не переписывается задним числом.
Типовой выпуск содержит:
- README: назначение, содержание, навигация.
- MANIFEST: полный перечень файлов с контрольными суммами.
- VERSION: номер версии, дата создания, флаги качества.
- Все файлы данных по всем трём методам с журналами.
Что это даёт:
- Воспроизводимость: из архива можно заново пересчитать все, что было сделано.
- Проверяемость: рецензент может видеть, какие параметры использовались, какие данные были источником, как менялись результаты.
- Истории: можно проследить, как развивались исследования, какие гипотезы были выдвинуты и почему они изменились.
Если через год появятся новые источники, можно создать версию 2. Она не перепишет версию 1 — версия 1 остаётся архивом. Версия 2 дополнит её новыми данными и новыми результатами. Читатель сможет видеть оба результата и понимать, что изменилось.
10. Границы применимости и честное указание на ограничения
Метод работает хорошо, когда:
- Корпус достаточно большой и многоканальный (есть несколько независимых типов источников).
- Хронологические сдвиги существенны (±5–50 лет), что даёт пространство для анализа.
- Можно идентифицировать независимые каналы свидетельств.
- Необходимо объективное ранжирование конкурирующих гипотез.
Метод имеет ограничения, когда:
- Корпус разреженный (мало источников, мало пересечений).
- Качество источников неоднородно и трудно оценить.
- Допуски выбраны неправильно (слишком узкие исключают реальные гипотезы, слишком широкие дают шум).
- Нет достаточного количества независимых каналов (BT-REI требует минимум трёх).
Что это означает:
Если метод указывает на красный статус (гипотеза не пройдена), это может значить:
- Гипотеза действительно неверна.
- Или корпус недостаточен для её проверки.
- Или допуски выбраны неправильно.
Это не провал метода — это честный результат. Метод говорит: при текущих данных и текущих допусках эта гипотеза не получает поддержки. Нужны новые данные или пересмотр допусков.
11. Почему это изменит историческую науку
Эта методология не заменяет традиционную историю. Она комплементирует её. Филолог всё ещё должен читать тексты, понимать их контекст, чувствовать нюансы языка. Археолог всё ещё должен работать с артефактами.
Но есть то, что методология изменит фундаментально:
- Конец чёрным ящикам. Решения станут прозрачны. Рецензент сможет видеть, как они приняты.
- Конец авторитарности. Решение будет обоснованно численно, а не апелляцией к авторитету.
- Конец переписыванию историй. История станет функцией явных данных и явных параметров. Если данные или параметры другие, результат может измениться, но это будет видно.
- Возвращение спора в область фактов. Вместо того чтобы спорить о том, кому верить, будем спорить о том, какие допуски выбрать, какие приоры использовать, как интерпретировать противоречия.
Именно это отличает науку от риторики.
Далее в серии:
Глава 2 описывает, как организованы корпусы и слои данных, какие метаданные необходимы, как нормализуются календари и географические привязки.
Глава 3 развёртывает IA-Δ: типы окон, процедуры генерации выравниваний, логистические модули.
Глава 4 подробно разбирает BT-REI: как задаются априоры, как вычисляются правдоподобия, как ведётся журнал источников.
Глава 5 объясняет S³-DELTA: как строятся сети, как проводятся стресс-тесты, как оцениваются устойчивость и риски.
Глава 6 показывает, как синтезировать результаты всех трёх методов в единое решение.
Глава 7 отвечает на вопрос: почему эта методология делает историю наукой ровно сейчас, в 2020-х годах.
ГЛАВА 2. КОРПУСЫ, СЛОИ И НОРМАЛИЗАЦИЯ: КАК ГОТОВЯТСЯ ДАННЫЕ
1. Цель и структура подготовки
Эта глава устанавливает единый стандарт подготовки данных для трёх методов — IA-Δ, BT-REI и S³-DELTA. Рассматривается организация корпусов и слоёв, определяются минимальные требования к метаданным, описываются процедуры приведения календарей и географической привязки к единому виду, формулируются правила независимости каналов. Итогом становится воспроизводимый технологический контур, который напрямую принимает разнообразные исторические источники — тексты, карты, археологические находки, монеты, ономастические данные и административные реестры — без предварительной переработки.
2. Что означают аббревиатуры методов
IA-Δ: интервальный анализ с контролируемым сдвигом
Ключевая идея — рассматривать даты и временные интервалы как полосы, а не точные моменты. Метод работает с явными окнами допустимого отклонения Δ как во времени, так и в пространстве. Название подчёркивает, что интервалы — основная единица, а отклонения контролируются и управляются явно.
BT-REI: байесовская триангуляция с источниковой трассировкой
Bayesian Triangulation — это объединение независимых наблюдений в единую вероятностную схему сравнения конкурирующих гипотез.
Record–Evidence–Influence — три оси отслеживания: запись (откуда взялось сведение), доказательство (взвешенные наблюдения и проверка правдоподобия), влияние (какой вклад каждый источник внёс в итоговую оценку гипотез).
S³-DELTA: структура, сигналы, стресс-проверки
Это модуль сетевой консолидации. Он строит структуру связей между объектами, выделяет устойчивые и повторяющиеся сигналы (включая топ-K ранжирование и теплокарты согласованности) и проводит жёсткие стресс-тесты надёжности: перестановки данных, блокировка отдельных каналов, поиск ложных двойников — всё это в рамках тех же Δ-окон.
S³-DELTA можно также называть BT-REI-ΔPATH-Graph, поскольку он включает три компоненты:
- ΔPATH-Graph — граф маршрутов согласования с взвешенными связями и правилом транзитивной совместимости;
- консолидацию — фильтрацию на основе вероятностных оценок BT-REI для переоценки весов;
- сетевые испытания — проверку структуры на прочность независимо от конкретной вероятностной модели.
Наименование S³-DELTA подчёркивает его самостоятельность: он не переоценивает исходные вероятности, а проверяет связность и надёжность сетевой структуры.
3. Три метода — три разные задачи
IA-Δ генерирует возможные варианты согласования в заданных диапазонах. BT-REI ранжирует конкурирующие гипотезы и отслеживает вклад каждого источника. S³-DELTA принимает эти результаты, поднимается на уровень сетевой структуры и проверяет, какие согласования выдерживают испытания на надёжность. Это последовательные слои единой технологической цепи, но каждый решает собственную задачу.
4. Основные единицы: корпус и слой
Корпус — связная по назначению и технологии совокупность слоёв.
Слой — однородная по типу данных единица: тексты, карты, находки, монеты, имена и т. д. Каждый слой имеет собственную схему полей, правила датировки и методы привязки к местности.
Корпусы строятся с расчётом, что ключевые регионы и периоды представлены минимум тремя независимыми каналами. Для средневековой Европы таким естественным триумвиратом служат Папство, Византия и Священная Римская Империя — они дают устойчивую триангуляцию и защищают от однобоких ошибок в отдельных каналах.
5. Что обязательно должно быть в метаданных
Каждый слой содержит:
Идентификацию и цитируемость. Устойчивый идентификатор записи, полное описание произведения или свидетельства, точную ссылку на фрагмент (если речь о цитате), язык и письмо, тип источника (рукопись, издание, перевод, другое).
Датировку. Исходное обозначение даты с указанием календаря, затем нормализованный интервал [минимум, максимум] с указанием типа неопределённости (равномерно распределённая, треугольная или иная).
Географическую привязку. Исходное название места, нормализованное место (стандартный идентификатор и координаты/границы), класс точности, список альтернативных вариантов названия с вероятностями для многозначных топонимов.
Происхождение и надёжность. Полная цепочка передачи (из какого источника, через какие промежуточные тексты), оценка надёжности в диапазоне 0–1 с пояснением методики, указание канала (например, «Папство/буллы» или «Византия/хроники»).
Логистику маршрутов. Если речь о движении или перемещении — скорости передвижения по разным средам (река, море, дорога), сезонные ограничения, препятствия, известные переправы и повороты.
6. Как привести календари к единому виду
Основная ось — пролептический григорианский календарь (ISO-8601) для всех вычислений. Оригинальные календари сохраняются в параллельных полях.
Поддерживаемые конверсии:
- юлианский ↔ григорианский с учётом региональных дат реформ;
- византийская эра «от сотворения мира»;
- исламский календарь;
- местные эры и индиктионы.
Каждое преобразование записывается в журнал нормализации.
Всегда используются интервалы. Даже кажущиеся точными даты моделируются как небольшие интервалы — это позволяет применять Δ-окна согласованно и не переоценивать точность исходных данных.
Версионирование. Любое обновление правил преобразования сопровождается пересчётом и фиксацией контрольных сумм и номеров версий.
7. Геокодирование и допуски в пространстве
Привязка к местности ведётся через стандартные идентификаторы справочников (gazetteer) в виде точки или полигона. Для неоднозначных топонимов сохраняется список возможных вариантов с вероятностными весами. IA-Δ использует эти альтернативы при генерации вариантов согласования, S³-DELTA — при построении графа согласований и последующих стресс-тестах.
8. Независимость каналов
BT-REI требует как минимум три канала, явно независимых по происхождению и способу записи. Примеры: папские буллы, византийские официальные документы, имперские дипломы Священной Римской Империи.
Принцип независимости обязательно фиксируется в метаданных слоя и проверяется на этапе объединения данных. Критическое правило: один и тот же текст, даже переписанный в разные корпусы, не считается независимым каналом свидетельства.
9. Как данные переходят к вычислениям
IA-Δ получает нормализованные интервалы дат и локаций, плюс параметры окон Δ. Выдаёт пространство допустимых вариантов согласования со всеми альтернативами.
BT-REI принимает эти варианты как конкурирующие гипотезы, задаёт исходные вероятности и правила оценки для каждого канала, возвращает ранжированный список с полным журналом Record–Evidence–Influence.
S³-DELTA строит и уплотняет граф согласований, выделяет повторяющиеся сигналы, запускает сетевые испытания (перестановки, блокировки каналов, поиск ложных двойников) и показывает, какие гипотезы выживают при жёстких проверках.
10. Практические требования к контролю качества
Единообразие полей. Одно и то же поле (например, нормализованное место) заполняется по одним и тем же правилам во всех слоях. Альтернативные варианты — отдельным списком с весами.
Явное указание неопределённости. Тип и ширина неопределённости записываются в структурированные поля, а не только в текстовые примечания.
Разделение оригинала, перевода и компиляции. Каждый тип источника — отдельная запись со своей цепочкой происхождения.
Журнал преобразований. Каждый шаг нормализации (конверсия календаря, геокодирование, логистика) должен быть записан в журнал. Это необходимо для трассировки влияния источников и воспроизводимости результатов.
Следующая глава формализует IA-Δ: будут описаны типы окон и виды неопределённостей, правила генерации альтернативных вариантов и критерии, по которым выравнивание считается допустимым.
ГЛАВА 3. IA-Δ: ИНТЕРВАЛЬНЫЕ ОКНА И ГЕНЕРАЦИЯ ДОПУСТИМЫХ ВЫРАВНИВАНИЙ
1. Задача и роль IA-Δ в системе
IA-Δ (интервальный анализ с контролируемым сдвигом) — первый вычислительный этап, который переводит разнородные и неполные исторические свидетельства в набор возможных согласований. Его цель не доказать гипотезы и не присвоить им вероятности (этим занимается BT-REI) и не проверить устойчивость сетевой структуры (это S³-DELTA). IA-Δ строит полный, воспроизводимый список того, что может быть согласовано при заданных допусках, и отсекает то, что согласовано быть не может.
2. Основные понятия
Событие — запись в слое корпуса с нормализованными полями времени и места.
Временной интервал события — пара чисел [t_min, t_max]. Даже дата, которая выглядит точной, моделируется как небольшой интервал.
Топоним — набор вариантов названий {p₁, p₂, ...} с весами и геометрией (точка или полигон).
Δ-окно — допуск на расхождение:
- Δ_t — по времени (ошибки в летоисчислении, перекодировке, задержки в переписке);
- Δ_s — по пространству (неточность определения места, близость точек на маршруте);
- Δ_l — по названиям (варианты имён, разные названия одного народа, переводные формы).
Выравнивание — соответствие между двумя или несколькими событиями, которое удовлетворяет правилам IA-Δ.
3. Какие неопределённости допускает система
IA-Δ работает с тремя основными типами:
Равномерная (U). Все точки в интервале одинаково вероятны — используется, когда нет оснований предпочесть одну часть интервала другой.
Треугольная (Tri). Вероятность выше в центре и падает к краям — применяется для расплывчатых дат типа «около 1050 года».
Смешанная (Mix). Комбинация жёсткого ядра (точная или близкая дата) и мягких хвостов (где дата может быть с меньшей вероятностью) — типична для документов с колебаниями в разных рукописях.
Тип неопределённости указывается в метаданных события и влияет на отсев конфликтов — резко противоречивые данные отбрасываются быстро, чтобы не создавать лавину ложных кандидатов.
4. Правила согласования: когда события могут быть связаны
Пусть события A и B могут быть выравнены. Они согласуются, если выполнены три условия.
По времени. Интервалы, расширенные на допуск Δ_t, должны пересекаться:
[t_min(A) − Δ_t, t_max(A) + Δ_t] ∩ [t_min(B) − Δ_t, t_max(B) + Δ_t] ≠ ∅
По пространству. Должна существовать пара мест p из события A и q из события B такая, что расстояние между ними d(p, q) ≤ Δ_s, либо оба места лежат в одном транспортно-логистическом кластере (раздел 3.7).
По названиям. Расстояние между именами (по звучанию, написанию или структуре слова) ≤ Δ_l, или пара имён уже подтверждена справочником эквивалентностей — например, «Winuli» ↔ «Wandali» ↔ «Венеды» в одном источнике.
По смыслу. Для причинно-связанных событий (последовательность правителей, война → мир → ратификация) не должны возникать логические циклы — если A произойдёт до B, то B не может быть причиной A.
Транзитивность. Если событие A согласуется с B, а B согласуется с C, то A должно согласоваться с C, иначе это — признак конфликта, требующий внимания.
5. Как избежать комбинаторного взрыва: лестница фильтров
Если просто сравнивать все события со всеми, возникнет бесчисленное количество кандидатов. IA-Δ применяет последовательные фильтры:
Шаг 1: временной индекс. Быстрый поиск выделяет только те пары событий, чьи расширенные временные интервалы хоть как-то пересекаются. Все остальные отклоняются.
Шаг 2: географический отсев. Для оставшихся событий проверяется, лежат ли их места в допустимом расстоянии Δ_s или в одном транспортном кластере.
Шаг 3: проверка имён. Применяется метрика сходства имён и таблицы соответствий этнонимов и топонимов.
Шаг 4: локальные правила. Для каждого типа документов свои ограничения. Для папских булл: документ не может быть датирован позже смерти подписавшего его папы. Для территориальных описаний: границы (например, река Пене как рубеж) накладывают жёсткие ограничения на допустимые места.
Шаг 5: сценарии. Из пар событий, прошедших все фильтры, собираются минимальные согласованные наборы — такие, в которых нет логических противоречий.
Результат: компактный перечень сценариев выравнивания с полным журналом — какие фильтры каждый из них пройти, какие сузили.
6. Логистика: когда путь невозможен, гипотеза невозможна
Часто историческую правдоподобность решает не текстология, а практическая возможность. Для этого IA-Δ использует логистические параметры:
Среды движения: река, побережье, открытое море, сухопутный путь.
Скорости: для каждой среды — минимум, медиана и максимум, с поправками на сезон.
Инфраструктура: переправы, порты, волоки (место, где лодку переносили между реками), коридоры проходимости.
Сезонность: когда ледостав, когда штормы, когда распутица.
Каждый сценарий получает логистическую метку: «допустим», «сомнителен» или «невозможен» — до всяких вероятностных оценок. Если два события синхронны по времени, согласованы по месту и именам, но маршрут между ними невозможен из-за ледостава или отсутствия переправы, — сценарий помечается как логистически недопустимый.
7. Как задавать размеры окон Δ
Δ_t (временной допуск). Зависит от типа источника и эпохи. Для позднесредневековых канцелярских документов — узкий (5–10 лет), для раннесредневековых хроник — шире (30–50 лет). Для переводных или компилятивных текстов допуск увеличивается дополнительно.
Δ_s (пространственный допуск). Привязывается к точности карт слоя и масштабу. Для областей (полигонов) берётся минимальный осмысленный радиус, не дающий фиктивных совпадений.
Δ_l (лексический допуск). Зависит от языка, периода стандартизации письма, количества известных вариантов названий одного народа или места.
Все значения записываются в конфиг корпуса и при необходимости дифференцируются по каналам (например, отдельно для «Папства», «Византии», «HRE»).
8. Что выдаёт IA-Δ
Парные выравнивания. Список пар событий с пометками: какие фильтры пройдены, типы неопределённостей, найденные лексические соответствия, логистическая оценка.
Сценарии. Минимальные согласованные наборы событий — каждый с диапазоном времени, набором географических вариантов, статусом логической совместимости.
Конфликт-лог. Запись о том, где и почему были отвергнуты события или сценарии — необходима для последующей трассировки в BT-REI.
Статистика фильтров. Сколько допустимых выравниваний осталось после каждого шага — это показатель качества исходных Δ-окон. Если их слишком много, окна слишком широки; если слишком мало, закрыты реальные гипотезы.
Все артефакты получают стабильные идентификаторы, чтобы BT-REI мог точно ссылаться на любой результат IA-Δ.
9. Простой пример
Предположим, три канала — папская булла о границах Славии, византийское сообщение о тех же землях, имперский документ HRE.
Время. Интервалы пересекаются, если установить Δ_t = 15 лет.
Место. Топонимы попадают в один балтийский кластер портов и устьев рек при Δ_s = 60–80 км.
Имена. «Sclavinia / Slavia» и «Славония» связаны таблицей эквивалентности. Локальные этнонимы проверены на Δ_l.
Логистика. Сухопутный вариант помечен «зимой сомнителен»; морской вариант — «допустим».
Результат. Сценарий проходит IA-Δ и передаётся в BT-REI как кандидат на совпадение, но без вероятностных оценок — только с протоколом допустимости.
10. Частые ошибки и как их избежать
Ложная точность. Использование точных дат вместо интервалов создаёт вымышленные конфликты. IA-Δ всегда требует интервалов.
Смешение каналов. Одна хроника в двух разных изданиях — это один канал, не два независимых. Независимость определяется до начала анализа.
Перекошенные окна. Слишком широкие Δ порождают шум; слишком узкие — закрывают реальные гипотезы. Правильный режим: после фильтров остаётся умеренное количество сценариев, пригодных для байесовского сравнения.
Игнорирование логистики. Тексты могут совпадать, но физически маршрут невозможен. IA-Δ обязан такое пометить.
11. Передача результатов дальше
Каждый сценарий IA-Δ экспортируется в форме:
- Гипотеза для BT-REI с полным журналом допустимости — что и почему прошло, что было отвергнуто;
- Рёбра для S³-DELTA — допустимые соответствия, где Δ-окна преобразуются в веса начальной уверенности и ограничения при построении графа согласований.
Следующая глава развёртывает BT-REI: как задаются исходные вероятности, как прерывается правдоподобие по независимым каналам, как ведётся запись Record–Evidence–Influence и как идёт сравнение конкурирующих сценариев IA-Δ.
ГЛАВА 4. BT-REI: БАЙЕСОВСКАЯ ТРИАНГУЛЯЦИЯ И ТРАССИРОВКА ИСТОЧНИКОВ
1. Задача и смысл метода
BT-REI (Bayesian Triangulation with Record–Evidence–Influence logging) — центральный оценочный уровень, который преобразует допустимые сценарии IA-Δ в вероятностно сопоставимые гипотезы. Он не корректирует источники и не навязывает единую версию истории. Его задача — выразить количественно, насколько каждый сценарий соответствует полученным наблюдениям, и оставить полную запись принятых решений.
Главный принцип: противоречия не отбрасываются, а учитываются как данные. Метод открыто фиксирует, какая запись дала какие наблюдения и как они влияют на итоговые веса гипотез.
2. REI-журнал: три уровня аудита
Полная трассировка ведётся по трём осям:
Record (запись). Конкретный исторический источник — документ, летопись, карта, канцелярский акт с информацией о происхождении, датировке, канале происхождения и оценке надёжности.
Evidence (свидетельство). Извлечённый из записи наблюдаемый признак: дата, место, имя, маршрут, титул, формула, рангодержатель. Это конкретная, поддающаяся измерению единица информации.
Influence (влияние). Численное воздействие свидетельства на вероятность гипотезы через функцию правдоподобия с указанием допусков и ошибок. Это число показывает, насколько данное свидетельство усиливает или ослабляет гипотезу.
REI-журнал обеспечивает воспроизводимость: читающий его видит, шаг за шагом, как гипотеза получила свой итоговый вес.
3. Гипотезы и начальные вероятности
На входе BT-REI — набор сценариев из IA-Δ, каждый описывает варианты согласования. Для каждого задаётся априор, то есть начальная вероятность (P(H)) — это не произвол, а расчёт:
- качество канала: канцелярские акты позднего Средневековья ценятся выше, чем позднейшие компиляции;
- независимость: два переписанных друг от друга списка одной хроники не удваивают вероятность;
- сложность: гипотезы с большим числом допущений получают ниже априор.
Априор — это начальное доверие, выстроенное на основе типа источников, прежде чем мы посмотрели на конкретные наблюдения. Он может варьироваться для проверки устойчивости результата.
4. Функции правдоподобия по каналам
Правдоподобие (P(E|H)) моделирует, насколько естественны наблюдаемые признаки, если верна гипотеза. Система использует модульные компоненты:
Временной компонент. Для датировки — свёртка распределений неопределённости события и допусков гипотезы (равномерные, треугольные, смешанные), со штрафом за выход за пределы Δ_t, принятый в IA-Δ.
Пространственный компонент. Для местоположения — вероятность расположения в рамках транспортно-логистического графа (узлы, маршруты, сезонные окна). Если по источникам требуется сухопутный путь, но гипотеза предполагает морской — правдоподобие падает.
Ономастический компонент. Меры сходства имён (звучание, написание, морфология) плюс известные таблицы эквивалентностей. Редкие трансформации имён без контекстной поддержки получают штраф.
Институциональный компонент. Согласованность титулов, юрисдикций, границ епархий, канцелярских формул. Несовместимые титулы или формулы резко понижают правдоподобие.
Логический компонент. Последовательности (правитель → решение → действие) моделируются как частично упорядоченные процессы. Нарушения порядка резко ослабляют гипотезу.
Каждый компонент возвращает числовой вес и текстовое объяснение, которые заносятся в REI-журнал.
5. Независимость и эффект эха
Классическая ошибка — суммировать свидетельства без проверки их зависимости. Если две хроники опирались на один протограф, то они не дают двойного подтверждения, а один раз подтверждают.
BT-REI группирует источники по кластерам происхождения (скрипторий, канцелярия, компилятор). Для зависимых источников вводится понижающий коэффициент: несколько производных свидетельств не приравниваются к нескольким независимым. Это резко снижает риск искусственного усиления уверенности через «эхо» одной и той же традиции.
6. Расчёт и ранжирование
Апостериорная вероятность гипотезы (P(H|E)) пропорциональна произведению разных компонент:
начальная вероятность (P(H)) × произведение правдоподобий по компонентам, с учётом кластеризации зависимых источников.
Нормировка выполняется по всем конкурирующим гипотезам, что позволяет не только упорядочить их, но и вычислить байес-факторы — отношения вероятностей для попарного сравнения.
Важно: BT-REI оперирует только имеющимися данными. Если свидетельство недоступно или его извлечение сомнительно, оно не включается; причина пропуска записывается в журнал. Это предотвращает искажение результата подгонкой.
7. Как противоречия становятся информацией
Противоречия учитываются тремя способами:
Штрафы в правдоподобии. Каждое несоответствие между гипотезой и наблюдением — это численный штраф, прозрачно видимый и локализуемый.
Ветвление гипотез. Конфликтующие трактовки оформляются как отдельные сценарии с собственными апостериорами.
Диагностика источника. Если конкретный канал систематически расходится с другими, его вклад понижается — как если бы свидетель оказался менее надёжным. Это фиксируется в журнале Influence.
Таким образом, несогласие источников не скрывается, а используется.
8. Калибровка и проверка устойчивости
Любое байесовское ранжирование зависит от априоров и параметров допусков. Поэтому требуется:
Эталонные примеры. Учебные случаи с общепринятой датировкой и локализацией для подстройки штрафов.
Вариантные прогоны. Систематическое изменение априоров, допусков, весов каналов с публикацией диапазонов, в которых результат остаётся стабильным.
Диаграммы влияния. Визуальное представление вклада каждого канала и признака, показывающие, какие элементы делают результат «жёстким», а какие его колеблют.
9. Что выдаёт BT-REI
Таблица гипотез. Список всех сценариев с начальной вероятностью, вкладами по компонентам, итоговой вероятностью, байес-факторами и оценкой устойчивости.
REI-журнал в машиночитаемом виде. Для каждого свидетельства — источник, извлечение, функция правдоподобия и численный вклад.
Отчёт о зависимостях. Кластеры происхождения и применённые понижающие коэффициенты.
Диаграммы влияния. Рангирование вкладов каналов, выявляющее, какие именно источники решают исход.
Эти артефакты становятся входом для S³-DELTA: сетевой граф строится не с нуля, а опираясь на наиболее вероятные рёбра и узлы.
10. Пример в общих чертах
Предположим, IA-Δ выдал три сценария (А, B, C) для одного события. Источники: латинские буллы с границами, имперские акты, унифицированная картография.
Сценарий А. Временные интервалы совпадают, но топонимы требуют редкого соответствия — лексический штраф.
Сценарий B. Титулы и формулы документов безупречны, но логистика сомнительна в зимний период — пространственный штраф.
Сценарий C. Всё согласовано умеренно хорошо, но некоторые источники зависят от общей основы — применяется понижение.
После расчёта апостериор может отдать первенство C, но отчёт покажет: если улучшить независимые картографические свидетельства, B сразу поднимается. Это не предположение, а численно подтверждённая чувствительность.
11. Что означает название и чем метод не является
Bayesian Triangulation подчёркивает сравнение конкурирующих сценариев через вероятностные оценки. Record–Evidence–Influence — полная трассировка от документа к наблюдению и к итоговому весу. Метод не генерирует сценарии (это IA-Δ) и не проверяет устойчивость сетевой структуры (это S³-DELTA).
S³-DELTA можно называть BT-REI-ΔPATH-Graph, поскольку он включает графовые модули маршрутизации, опирающиеся на апостериоры BT-REI и окна IA-Δ. Однако S³-DELTA — это сетевой надстроечный анализ, а не вероятностная оценка и не генератор допусков.
Следующая глава развёртывает S³-DELTA как финальный модуль: как из вероятностных результатов BT-REI строится граф соответствий, как проводятся стресс-тесты устойчивости, как выявляются ложные совпадения и как принимаются решения при конфликтующих высоковероятных выравниваниях.
ГЛАВА 5. S³-DELTA: СЕТЕВАЯ УСТОЙЧИВОСТЬ, СТРЕСС-ТЕСТЫ И МАРШРУТИЗАЦИЯ
1. Роль и назначение
S³-DELTA — финальный сетевой уровень, который принимает результаты предыдущих этапов:
- допустимые сценарии и их допуски из IA-Δ;
- вероятностные веса соответствий из BT-REI.
Его задача — проверить, как вся построенная конструкция выдерживает возмущения: отказы источников, блокировки путей, сдвиги допусков, сезонные ограничения, альтернативные трактовки. Результатом являются оценки устойчивости, выявление «узких мест», анализ критических зависимостей и итоговые решения о пригодности гипотез.
2. Как представлены данные: многоуровневый граф
S³-DELTA работает с мультиграфом — сложной сетевой структурой:
Узлы: события и исторические персоны, географические локусы (топонимы, юрисдикции), временные опоры (якорные даты и датовые окна).
Рёбра трёх типов:
- соответствия между событиями (текстовые и ономастические эквиваленты);
- логистические связи (маршруты, скорости, сезонность);
- институциональные связи (титулы, канцелярии, границы).
Слои: текстовый, картографический, дипломатический, транспортно-логистический — каждый содержит свои типы связей.
Веса: апостериоры из BT-REI (вероятность рёбер), допуски из IA-Δ (временные окна, расстояния), сезонные и режимные ограничения.
Такое представление позволяет одновременно учитывать, что говорят источники, где и когда это возможно, и как информация могла физически передаваться в рамках допустимых коридоров.
3. ΔPATH: маршрутизация с временными окнами
Модуль ΔPATH решает логистическую задачу маршрутизации:
Развёртывание по времени. Узлы графа дублируются для каждого временного слоя; ребро считается допустимым только если оно соблюдает окна IA-Δ и сезонные условия.
Режимные преграды. Сухопутные, речные и морские участки имеют разные скорости и сезонные окна (ледостав, штормы).
Критерии состоятельности. Коридор считается допустимым, если: существует хотя бы один маршрут в окнах; основная доля путей выдерживает стресс-тесты; время/риски маршрута соразмерны альтернативам.
Результат: не просто «да, путь возможен», а численная оценка маршрутизируемости сюжета при заданных условиях.
4. Три типа проверок (S¹, S², S³)
S¹: Структура
Связность и разрезы — выявление минимальных наборов рёбер и узлов, удаление которых разрывает гипотезу.
Центральности — поиск «мостов», через которые проходит основной поток объяснений. Такие элементы критичны для гипотезы.
k-устойчивость — сохраняется ли связность при потере до k зависимых свидетельств (учитывается кластеризация источников).
S²: Стабильность
Вариантные прогоны — систематическое изъятие кластеров источников (оставьте один канал — используй остальные); переоценка признаков; внесение шума в допуски.
Ранговая устойчивость — совпадает ли топ-K список соответствий при вариантах; как меняется ранг (τ-Кендалла); как распределяются байес-факторы между конкурирующими путями.
Инвариантность графа — сохраняются ли основные компоненты и сообщества при колебаниях весов в доверительных интервалах.
S³: Стресс-тесты
Отказы каналов — имитация утраты картографических или дипломатических источников; исключение «шумных» протографов.
Блокировки путей — сезонные закрытия, ледостав, война, таможни; пересчёт достижимости после блокировок.
Лексические вариации — усиление/ослабление правил совпадения имён и транслитераций.
Скоростные колебания — ухудшение/улучшение темпов передвижения для оценки чувствительности маршрутов.
Итог: полная карта уязвимостей и сценариев, при которых гипотеза разваливается или, напротив, остаётся жизнеспособной.
5. Решения и статусы
Для каждого соответствия, маршрута или сценария S³-DELTA присваивает:
Статус:
- Зелёный — устойчиво выдерживает все проверки;
- Жёлтый — условно; результат зависит от конкретных факторов;
- Красный — нестабилен; при разумных возмущениях рушится.
Критические наборы. Минимальные множества источников или рёбер, обеспечивающие связность гипотезы (если их нет — гипотеза висит на одной ниточке).
План доверификации. Перечень данных, которые способны наиболее существенно изменить статус — на них следует сосредоточить дополнительные исследования.
6. Почему S³-DELTA можно называть BT-REI-ΔPATH-Graph
S³-DELTA допустимо именовать BT-REI-ΔPATH-Graph, поскольку содержит:
- граф, где веса рёбер — это апостериоры BT-REI;
- встроенный модуль ΔPATH для маршрутизации в окнах IA-Δ;
- все стресс-проверки выполняются поверх взвешенной структуры.
Однако S³-DELTA не равен BT-REI (не вычисляет вероятности) и не равен IA-Δ (не генерирует допуски). Это третья ступень — сетевой анализ устойчивости и выбор решений по критерию надёжности.
7. Что выдаёт S³-DELTA
Паспорт соответствия. Для каждого соответствия или маршрута — апостериор BT-REI, графовые метрики (центральность, разрезы), сценарные статусы, карта рисков.
Карта коридоров. Карта достижимости: какие сюжеты маршрутизируемы по сезонам и в зависимости от режима (война/мир, торговля/блокада).
Отчёт устойчивости. Полные результаты S¹–S³, диаграммы чувствительности, перечень критических зависимостей, выявление узких мест.
Регистр решений. Какие гипотезы принимаются к синтезу, какие требуют доверификации, какие исключаются.
8. Пример в общих чертах
Две конкурирующие гипотезы имеют близкие вероятности в BT-REI. S³-DELTA показывает:
Гипотеза A. Опирается на одно «мостовое» ребро из картографического слоя. При его удалении гипотеза распадается — красный статус.
Гипотеза B. Сохраняет связность при потере любого одного источника; выдерживает сезонные блокировки; маршруты альтернативны — зелёный статус.
Решение: приоритет B. Для A сформировать запрос на доверификацию именно мостового элемента.
9. Типовые ошибки и как их избежать
Игнор связности. Гипотеза может быть вероятной, но зависеть от единственного слабого источника. S³-DELTA такое обнаруживает.
Недостаточная сезонность. Логистические модели без учёта ледостава, штормов или распутицы дают фиктивные маршруты.
Смешение независимости. Если критические рёбра лежат в одном кластере источников (общий протограф), потеря кластера разваливает гипотезу.
Отсутствие альтернатив. Если для сюжета существует только один маршрут, он — узкое место; если несколько, гипотеза устойчивее.
10. Передача в финальный синтез
Каждый сценарий S³-DELTA экспортируется как:
- Рейтинг по критерию устойчивости с полным обоснованием;
- Граф уязвимостей для выявления, где искать новые данные;
- Рекомендация по использованию: принять, принять условно, отложить, отвергнуть.
Следующая глава синтезирует результаты всех трёх слоёв (IA-Δ, BT-REI, S³-DELTA) в единую процедуру публикации выводов, включая стандартизованный отчёт и правила представления неоднозначных случаев.
ГЛАВА 6. СИНТЕЗ ТРЁХ МЕТОДОВ: ОТ КОНФЛИКТОВ К ВЕРИФИЦИРУЕМОМУ ВЫВОДУ
1. Для чего нужен синтез
После того как IA-Δ выстроил интервальные окна допустимости, BT-REI рассчитал вероятности, а S³-DELTA проверил устойчивость, возникает вопрос: как всё это соединить в единое решение? Синтез — это протокол, который объединяет три слоя в одну систему принятия решений.
Представьте себе три независимых эксперта. Первый говорит: «По датам и местам это согласуется». Второй говорит: «По источникам и их качеству это вероятно». Третий говорит: «По структуре графа это надёжно». Синтез переводит их мнения в единую оценку, которая говорит: принять, принять условно или отклонить.
Главная идея: не нужно выбирать между тремя методами. Нужно использовать все три как дополняющие друг друга линзы, смотря через которые на одно явление, мы получаем полную картину.
2. Пять показателей качества
Для каждого утверждаемого вывода рассчитываются пять независимых показателей. Каждый измеряет что-то своё, и вместе они дают полную оценку надёжности.
2.1. Δ-согласованность (ΔC)
Это показатель из IA-Δ. Он отвечает на вопрос: «Какая доля свидетельств укладывается в принятые интервальные окна?»
Представьте, у вас есть 100 фактов из источников. Вы установили допуск на время (скажем, ±20 лет), на место (±50 км) и на имена (расстояние соответствия ≤2 редакции). Теперь считаете: сколько из этих 100 фактов прошли все три проверки?
Если 75 из них согласованы, ΔC = 0,75. Если только 40, то ΔC = 0,40. Значение от 0 до 1, где 1 — идеальное совпадение.
Что означает в практике:
- ΔC ≥ 0,7 — отличное совпадение в окнах, можно доверять;
- 0,5 ≤ ΔC < 0,7 — приемлемое, но есть шум;
- ΔC < 0,5 — окна, похоже, неправильно установлены, или гипотеза не подходит.
2.2. Апостериор соответствия (Post)
Это результат BT-REI. Он отвечает на вопрос: «Насколько вероятна эта гипотеза, учитывая все свидетельства и их происхождение?»
Вы взяли все источники — летописи, акты, карты, монеты. Взвесили их по надёжности (канцелярские акты выше, позднейшие компиляции ниже). Для каждого источника посчитали, на сколько он поддерживает или противоречит гипотезе. Потом объединили все эти голоса, учитывая, что некоторые источники зависимы друг от друга.
Результат — число от 0 до 1. Например, Post = 0,72 означает: при текущих данных и при текущем понимании их надёжности эта гипотеза имеет 72-процентную вероятность.
Что означает в практике:
- Post ≥ 0,75 — сильное свидетельство, гипотеза вероятна;
- 0,6 ≤ Post < 0,75 — умеренное свидетельство, но стоит проверить узкие места;
- Post < 0,6 — слабое свидетельство, нужны дополнительные данные.
2.3. Маршрутизируемость (RF — route feasibility)
Это показатель из ΔPATH-модуля S³-DELTA. Он отвечает на вопрос: «Может ли информация физически передаваться между двумя событиями в установленные сроки, учитывая географию, скорости и сезонность?»
Например, вы утверждаете, что папа в Риме узнал новость из Киева за 3 месяца. Но маршрут займёт минимум 4 месяца даже летом, зимой 6, да ещё переправы закрыты. Значит, RF будет низким — путь возможен, но условно и только в узком сезонном окне.
RF от 0 до 1:
- RF ≥ 0,6 — маршрут допустим в обычных условиях;
- 0,4 ≤ RF < 0,6 — маршрут возможен, но сезонно ограничен или требует альтернативных путей;
- RF < 0,4 — маршрут практически невозможен в указанный срок.
Почему это важно: два события могут прекрасно согласовываться текстологически и вероятностно, но если между ними нет физического пути — это признак, что что-то не так. Может быть, редатировка, может быть, искажение места, может быть, просто ошибка в источнике. RF это выявляет.
2.4. Устойчивость (SG — stability grade)
Это показатель из S³-DELTA. Он отвечает на вопрос: «Насколько вывод выдерживает возмущения? Если убрать один источник, изменить допуск, заблокировать маршрут — рушится ли вывод?»
Представьте, что ваш вывод держится на одном единственном мостовом ребре в графе. Если это ребро удалиться (источник окажется ненадёжным, либо маршрут закроется), всё развалится. SG низкий.
Напротив, если вывод опирается на несколько независимых и резервных путей, то потеря одного не критична. SG высокий.
SG от 0 до 1:
- SG ≥ 0,7 — структура устойчива, выдерживает возмущения;
- 0,5 ≤ SG < 0,7 — структура умеренно устойчива, но есть уязвимые точки;
- SG < 0,5 — структура хрупкая, слишком зависит от отдельных элементов.
2.5. Риск источниковой зависимости (SR — source risk)
Это показатель, комбинирующий данные из всех трёх слоёв. Он отвечает на вопрос: «Насколько вывод держится на узком кластере источников? Если этот кластер окажется ненадёжным, какой процент вывода рушится?»
Например, все основные свидетельства происходят из одного скриптория X века, переписанного позже. Если этот скрипторий содержит систематическую ошибку, вывод может быть ложным. SR высокий.
Напротив, если свидетельства распределены по разным независимым источникам — папским актам, византийским хроникам, имперским документам — то систематическая ошибка маловероятна. SR низкий.
SR от 0 до 1:
- SR ≤ 0,3 — низкий риск, источники хорошо распределены;
- 0,3 < SR ≤ 0,6 — умеренный риск, есть зависимости, но есть и резервы;
- SR > 0,6 — высокий риск, вывод держится на узких местах.
3. Как эти пять показателей используются вместе
Это не «средний балл» и не «сумма». Это вектор оценки. Вы смотрите на пять цифр сразу:
ΔC = 0,72 | Post = 0,78 | RF = 0,65 | SG = 0,75 | SR = 0,25
Это говорит вам:
- интервальные окна согласуются хорошо (ΔC);
- источники поддерживают гипотезу (Post);
- маршрут возможен (RF);
- структура устойчива (SG);
- источники распределены (SR низкий).
Вывод: зелёный статус, принять.
Но другой пример:
ΔC = 0,68 | Post = 0,72 | RF = 0,35 | SG = 0,55 | SR = 0,58
Это говорит:
- окна согласуются (ΔC неплохо);
- источники поддерживают (Post неплохо);
- но маршрут сомнителен (RF низкий);
- структура хрупкая (SG среднее);
- вывод зависит от узких мест (SR высокий).
Вывод: жёлтый статус, условно принять, но выяснить, в чём именно узкое место.
4. Три уровня статусов и пороговые значения
4.1. Зелёный статус (принят)
Вывод готов к публикации в справочниках, учебниках, официальных хрониках. Все показатели выше порогов:
- ΔC ≥ 0,7
- Post ≥ 0,75
- RF ≥ 0,6
- SG ≥ 0,7
- SR ≤ 0,3
Физический смысл: интервальные окна согласуются, источники надёжны и независимы, маршрут возможен, структура выдерживает возмущения.
4.2. Жёлтый статус (условно принят)
Вывод включается в исследовательские работы, но с явными оговорками. Показатели ниже, чем для зелёного, но не критичны:
- ΔC ≥ 0,5
- Post ≥ 0,6
- RF ≥ 0,4
- SG ≥ 0,5
- Имеются узкие места (SR > 0,3)
Обязательные условия жёлтого статуса:
- чёткий перечень того, что именно неопределённо;
- план доверификации — какие данные способны изменить статус;
- явное указание факторов риска в тексте работы.
4.3. Красный статус (отклонён)
Вывод не публикуется как положительный результат. Он документируется в архиве как отрицательный результат (важно для метаанализа):
Причины отклонения:
- хотя бы один показатель провалил порог;
- RF близко к нулю (маршрут физически невозможен);
- SR очень высок без перспективы добавления независимых источников;
- конфликты в BT-REI не могут быть разрешены в пределах корпуса.
Отклонённый вывод сохраняется в архиве с полным описанием причин. Это важно: другой исследователь может потом предложить новые данные, которые переведут красный статус в жёлтый или даже в зелёный.
5. Паспорт вывода: документирование решения
Каждый зелёный или жёлтый результат оформляется в виде структурированного «паспорта» — документа, который содержит всю информацию, необходимую для понимания и воспроизведения вывода.
5.1. Раздел 1: Формулировка гипотезы
Здесь излагается суть вывода простым языком. Например:
«Событие A (папская булла об учреждении епископства в X) соответствует событию B (упоминание того же епископства в Y-хронике). Локализуется в регионе R, датируется интервалом [t1, t2].»
Ясная формулировка критична — она позволяет другим исследователям сразу понять, о чём идёт речь.
5.2. Раздел 2: Δ-профиль
Здесь описываются все допуски IA-Δ, которые были использованы:
- Временной допуск (Δ_t): ±20 лет (мотивация: компилятивные источники часто смещают даты).
- Пространственный допуск (Δ_s): ±50 км (мотивация: точность средневековых карт).
- Лексический допуск (Δ_l): фонетическое расстояние ≤2 транслитераций (мотивация: вариативность имён в разных списках).
- Логистический коридор: речной путь через три промежуточных узла, доступен весной-летом.
Для каждого допуска указывается, почему он выбран именно таким. Это позволяет рецензенту согласиться или предложить альтернативные допуски.
5.3. Раздел 3: BT-REI-профиль
Здесь описывается всё, что касается вероятностей:
- Исходные вероятности (априоры):
канцелярские акты: вес 1,0
позднейшие хроники: вес 0,6
компиляции: вес 0,4 - Свидетельства и их вклады:
Источник A говорит дату X: вклад +0,15
Источник B противоречит топониму: вклад −0,10
Источник C подтверждает маршрут: вклад +0,08 - Апостериор: 0,72
- Зависимости источников: источники C и D происходят из общего протографа, поэтому применён понижающий коэффициент 0,7.
Весь этот профиль позволяет другому исследователю пересчитать результат, если он считает, что какие-то веса неправильны.
5.4. Раздел 4: S³-DELTA-профиль
Здесь описываются результаты стресс-тестов:
- Графовые метрики:
узлы: 12
рёбра: 18
связные компоненты: 1 (граф связан)
минимальные разрезы: 2 ребра (если удалить любые два конкретных ребра, граф разорвётся) - Маршрутизируемость (RF): 0,65 — два независимых маршрута, оба в допусках
- Устойчивость (SG): 0,72 — граф выдерживает удаление любого одного источникового кластера
- Узкие места:
Мостовое ребро R1 (картография): если его удалить, граф останется связным, но маршрутизируемость упадёт с 0,65 до 0,40
Кластер источников K (общий протограф): если его исключить, апостериор упадёт с 0,72 до 0,58
5.5. Раздел 5: Статусы и пороги
Перечень всех пяти показателей с указанием, какие пороги перекрыты:
- ΔC = 0,72 (порог для зелёного: ≥0,70) — ✓ пройден
- Post = 0,72 (порог для зелёного: ≥0,75) — ✗ не пройден (касается)
- RF = 0,65 (порог для зелёного: ≥0,60) — ✓ пройден
- SG = 0,72 (порог для зелёного: ≥0,70) — ✓ пройден
- SR = 0,28 (порог для зелёного: ≤0,30) — ✓ пройден
Итоговый статус: ЖЁЛТЫЙ (Post немного ниже порога, но структура устойчива)
5.6. Раздел 6: План доверификации
Для жёлтого статуса обязателен чёткий план:
Для улучшения статуса до зелёного требуется:
- Найти независимый канал свидетельства, подтверждающий топоним Q (текущий апостериор зависит в 60% от одного источника). Приоритет: высокий (даст независимый канал).
- Проверить логистический узел N3 на предмет доступности в указанный период (маршрутизируемость сейчас лимитирована сезонным окном в 3 месяца). Приоритет: средний (расширит сезонное окно).
- Уточнить датировку события B через дополнительные источники (Post ограничена неопределённостью в 5 лет, что близко к пороговому Δ_t). Приоритет: низкий (небольшой эффект).
5.7. Раздел 7: Воспроизводимость и версионность
Здесь указываются все технические детали:
- Версия корпуса: архив_v103 (дата: 2025-11-13)
- Версия алгоритмов: IA-Δ v2.1, BT-REI v1.8, S³-DELTA v1.5
- Контрольная сумма: SHA-256 57a5834c68b9381c...
- Параметры конфигурации: [ссылка на JSON]
- Семя генератора случайности: 42 (для бутстрэпа)
- Дата расчёта: 2025-11-13, 01:45 MSK
- ПО: Python 3.11, байесовская библиотека pymc4
Любой исследователь с этой информацией может пересчитать результат на своём компьютере и получить идентичные цифры.
6. Как обращаться с противоречиями
Противоречия — не признак ошибки. Это данные о структуре корпуса.
6.1. Системные расхождения
Если один канал источников устойчиво расходится с другими (например, позднейшие переписи постоянно смещают даты на 10 лет), это не повод отбросить канал. Это повод:
- Повысить SR для этого канала (признак зависимости);
- Скорректировать его априор в BT-REI (назвать его менее надёжным, но не исключать);
- Описать систематическое расхождение в паспорте.
Пример: хроника X-века говорит одни даты, но все позднейшие переписи (которые зависели от общего протографа) говорят другие. SR повышается, но Post остаётся адекватным, если учесть происхождение.
6.2. Локальные конфликты
Если один-два источника противоречат основному потоку, это рассматривается не как ошибка, а как наблюдение:
- Вариант 1: конфликт — «ошибка писца» в одном списке. Тогда этот источник получает локальный штраф в правдоподобии.
- Вариант 2: конфликт указывает на альтернативную историческую версию. Тогда два конкурирующих сценария оформляются как жёлтые кейсы с планом доверификации.
- Вариант 3: конфликт критичен и перерезает единственный маршрут гипотезы. Тогда SG падает, и вывод может смещаться в красный статус.
7. Две версии отчётности
7.1. Консервативный отчёт (для справочников)
В этот отчёт включаются:
- все результаты со статусом зелёный;
- только хорошо мотивированные результаты жёлтый (с явным указанием условности);
- явное исключение результатов красный.
Такой отчёт пригоден для учебной литературы, справочников, официальных позиций. Читатель точно знает: то, что здесь написано, достаточно надёжно.
7.2. Исследовательское досье (для специалистов)
В этот документ включаются:
- все результаты, включая жёлтые и красные;
- полные карты уязвимостей для каждого;
- журналы всех параметров и вариантных прогонов;
- раздел «контраргументы» — альтернативные расчёты с другими приорами, допусками, весами.
Исследовательское досье — это не выводы, а рабочая материал для специалиста, который хочет глубоко разобраться или предложить свою интерпретацию.
Рецензент получает не финальную формулу, а полный набор воспроизводимых расчётов. Если он считает, что приор должен быть иным, он может пересчитать.
8. Версионность и история изменений
Любое обновление корпуса или конфигурации — это не переписывание, а новая версия:
Версия 101 (2025-10-15):
- Результат A: зелёный (ΔC=0,75, Post=0,78, RF=0,68, SG=0,76, SR=0,22)
- Результат B: жёлтый (узкое место в маршруте)
Версия 102 (2025-10-28):
- Добавлен новый источник по маршрутам
- Результат A: зелёный (улучшена RF до 0,75)
- Результат B: жёлтый (RF улучшена до 0,58, но всё ещё условно)
Версия 103 (2025-11-13):
- Уточнены логистические параметры
- Результат B: зелёный (RF теперь 0,72, все пороги перекрыты)
Каждая версия сохраняется полностью. Это предотвращает «переписывание истории» — вы всегда можете посмотреть, какой вывод был в какой момент и почему он изменился.
9. Границы применимости метода
Важно понимать: синтез трёх методов не заменяет традиционной филологической критики, дипломатики, палеографии, археологии. Он дополняет их.
Где метод работает хорошо:
- большие, многоканальные корпусы;
- конфликтные датировки и локализации;
- необходимость быстрой объективной оценки;
- нужна воспроизводимость и верифицируемость.
Где метод имеет ограничения:
- редкие, разреженные корпусы (мало данных для байесовской калибровки);
- системные искажения (весь канал ненадёжен);
- специальные случаи (палимпсесты, криптограммы), требующие экспертного анализа.
Правильный результат — смещение статуса в жёлтую или красную зону, если корпус разрежен. Это не провал модели, это честный сигнал: здесь нужны новые данные.
10. Пример полного синтеза
Два конкурирующих соответствия. IA-Δ допускает оба. BT-REI дал им близкие апостериоры (0,70 и 0,71).
Соответствие A
Показатели:
- ΔC = 0,75 (хорошо)
- Post = 0,70 (близко к порогу)
- RF = 0,38 (проблема)
- SG = 0,52 (умеренно)
- SR = 0,62 (высокий риск)
Анализ: маршрут опирается на один морской проход, который сезонно закрыт (RF=0,38). Вывод держится на кластере картографических источников из одного скриптория (SR=0,62). Структура хрупкая (SG=0,52).
Решение: ЖЁЛТЫЙ (или даже красный).
План: найти независимый канал подтверждения маршрута или переделировать событие.
Соответствие B
Показатели:
- ΔC = 0,68 (хорошо)
- Post = 0,71 (хорошо)
- RF = 0,71 (хорошо)
- SG = 0,78 (хорошо)
- SR = 0,25 (низкий риск)
Анализ: маршрут допустим (два независимых коридора), структура устойчива (выдерживает потерю одного источника), источники распределены (SR низкий).
Решение: ЗЕЛЁНЫЙ (рекомендуется к публикации).
Итоговое решение в работе
«Из двух конкурирующих соответствий A и B синтез трёх методов даёт приоритет B (зелёный статус). Соответствие A остаётся в исследовательском досье как жёлтый кейс, требующий дополнительной верификации маршрута.»
11. Типовые ошибки при синтезе
Ошибка 1: усреднение показателей.
Неправильно: «Среднее значение (0,75 + 0,72 + 0,65 + 0,55 + 0,28) / 5 = 0,59, значит жёлтый».
Правильно: каждый показатель проверяется отдельно против своего порога, затем принимается комбинированное решение.
Ошибка 2: игнор SR.
Неправильно: Post=0,80 — высокий, принимаем, даже если SR=0,75.
Правильно: Post=0,80 при SR=0,75 означает — вывод вероятен, но держится на узком месте; нужен жёлтый статус с планом доверификации.
Ошибка 3: отсутствие плана доверификации для жёлтых кейсов.
Неправильно: просто написать «жёлтый» и всё.
Правильно: ясно указать, какие данные способны перевести жёлтый в зелёный или в красный.
Ошибка 4: скрытие красных результатов.
Неправильно: отрицательные результаты просто не публиковать.
Правильно: документировать красные кейсы в архиве с полным описанием причин.
12. Переход к практике
После синтеза готовы:
- набор паспортов по всем принятым результатам;
- карта уязвимостей для планирования будущих исследований;
- протокол версионности с историей всех решений;
- рекомендации по пороговым значениям для похожих корпусов.
Всё это становится входом для завершающей главы — практического регламента, чек-листов и сценариев применения.
Следующая, заключительная глава формулирует практический стандарт: как организовать работу исследовательской группе, какие артефакты обязательны для воспроизведения, как представлять результаты в спорных кейсах, какие инструменты и сервисы использовать.
ГЛАВА 7. ПОЧЕМУ «ЦИФРОВАЯ ИСТОРИЯ» СТАНОВИТСЯ НАУКОЙ ИМЕННО СЕЙЧАС
1. Историческая наука и риск политизации
На протяжении десятилетий историческое знание оставалось уязвимым для идеологического перекраивания. Три причины делали это возможным:
Неполнота свидетельств. Источники разреженны и фрагментарны. Рукописей мало, они повреждены, содержат противоречия. Археологические находки случайны. Монет и документов недостаточно. Из такого неполного набора можно подобрать всё что угодно.
Непрозрачная процедура. Исследователь работает как чёрный ящик. Вот он читает летопись, вот решает, что это описание — о тех же событиях, вот выбирает, какие источники верить. Все эти решения неявны. Написанный текст скрывает всю цепь субъективных выборов. Критике открыты только выводы, не процедуры.
Асимметрия авторитета. Канонические издания, национальные историографические традиции, мнения авторитетных школ задают исходные «истины», из которых потом выводится всё остальное. Оспорить допущение, лежащее в основе, очень трудно — для этого нужна риторическая сила, а не аргумент.
В таком ландшафте политическая воля легко превращала историографию в инструмент легитимации. Спор превращался не в столкновение фактов, а в столкновение риторик и авторитетов.
2. Что изменилось в эпоху цифровых данных
Переход к «цифровой истории» стал возможен благодаря совпадению пяти явлений:
Датирование корпусов. Рукописи оцифрованы, печатные издания отсканированы, картографические фонды доступны. К текстам добавлены метаданные — даты, места, авторы, исходные языки. Появились связные каталоги (идентификаторы, онтологии), которые позволяют связывать один документ с другим.
Дешёвые вычисления. Байесовские модели, графовые алгоритмы, симуляторы маршрутизации теперь работают на обычном компьютере за секунды. Раньше такие расчёты требовали суперкомпьютеров. Теперь они доступны каждому исследователю.
Стандарты воспроизводимости. Появились инструменты и культура версионирования. Контрольные суммы, контейнеризация кода, фиксированные конфигурации, автоматические журналы изменений. Результаты можно дублировать: другой исследователь скачивает те же данные, те же параметры, запускает расчёт и получает идентичный результат.
Культура открытой методологии. Понимание сдвинулось от поиска «единственно правильного ответа» к регламентированной процедуре. Вывод — функция явных данных и явных порогов. Если данные или пороги другие, результат может измениться. Это видно заранее и может быть обсуждено.
Междисциплинарные протоколы. Методы из сетевого анализа, логистики, теории решений, лингвистики и геоинформатики стали совместимы. Они используют один и тот же язык — интервалы, вероятности, графы, метрики. Их можно проверять относительно друг друга.
Эта совокупность факторов закрыла прежние двери для спекуляции и открыла двери для расчёта.
3. Как три метода препятствуют политизации
Наша триада образует каркас противодействия идеологическому конструированию.
IA-Δ: интервальные окна
Делает явными и заранее зафиксированными границы допуска:
- по датам (±20 лет, ±50 лет — выбирается и фиксируется до анализа);
- по местоположению (±30 км, ±80 км);
- по названиям (фонетическое расстояние ≤2, ≤3).
Почему это препятствует политизации:
- Аномальные «растяжки» хронологии (когда автор ловко смещает все даты на 100 лет для идеологического переписывания) становятся видны: они нарушают установленные допуски и получают штраф.
- Споры типа «раньше это было, или позже?» перестают быть риторическими. Они становятся техническими вопросами о величине допуска. Две школы могут согласиться: «Если допуск ±15 лет — выход A, если ±40 лет — выход B». Потом можно обсуждать, какой допуск объективнее.
BT-REI: источниковая трассировка
Заменяет оценки типа «надёжный/сомнительный источник» на взвешенные и прозрачные расчёты:
- каждому источнику присваивается начальная вероятность (априор) на основе его происхождения (канцелярский акт X века выше, позднейшая компиляция ниже);
- фиксируется вклад каждого признака (если источник A говорит дату X, это +0,15 к правдоподобию; если B противоречит топониму, это −0,10);
- вычисляется итоговая вероятность гипотезы.
Почему это препятствует политизации:
- Авторитет источника перестаёт быть привилегией. Вместо этого используется явный расчёт. Два исследователя могут не согласиться с величиной априора: один скажет, что летопись X надёжна на 80%, другой скажет 60%. Но тогда они просто пересчитывают результат — и видят, как меняется апостериор при разных припущениях.
- Политическая риторика становится параметром модели. Если кто-то настаивает на том, что определённый источник священен и неошибим, это становится выбором априора. Такой выбор выглядит странно в расчётах и обсуждается как параметр, а не как истина.
- Выявляется зависимость источников. Если все основные свидетельства происходят из одного кластера (например, все позднейшие переписи зависели от общего протографа), то их множественность иллюзорна. Это видно в модели и снижает вес вывода.
S³-DELTA: сетевой стресс-анализ
Проверяет, насколько вывод хрупок:
- выявляет критические узлы (если удалить одно-два свидетельства, рушится ли вывод?);
- проверяет альтернативные маршруты (есть ли резервные пути объяснения событий?);
- тестирует устойчивость к параметрическим изменениям (если допуск шире/уже, ранжирование гипотез меняется?).
Почему это препятствует политизации:
- Идеологические конструкции обычно хрупки. Они держатся на единственной интерпретации одного источника. Такая конструкция имеет низкую устойчивость (SG). Стресс-тесты это выявляют.
- Наоборот, выводы, опирающиеся на множество независимых источников и альтернативные маршруты, имеют высокую устойчивость. S³-DELTA это количественно показывает.
- Публиковать становится стыдно результат с высоким риском источниковой зависимости (SR). Это давит на авторов в сторону более честной, многоканальной работы.
Совместно три метода превращают политическое «мнение» в паспортируемую гипотезу, которая имеет интервалы, апостериоры, графовые разрезы и оценки устойчивости. Её можно опровергнуть техническими аргументами, не прибегая к риторике.
4. Почему это стало возможно только сейчас
Несколько практических причин:
Масштаб данных. Без сплошных оцифрованных корпусов невозможно корректно оценить, зависит ли один источник от другого. Нужно видеть все тысячи документов и все связи между ними. Это было нереально при работе с бумажными картотеками.
Дешевизна расчётов. Байесовские апостериоры и стресс-тесты требуют десятков, сотен прогонов модели. Раньше пересчитать модель вручную было месячной работой. Теперь это секунда кода. Это изменило стимулы: исследователи теперь могут и хотят варьировать параметры и видеть, как меняется результат.
Унификация адресов. Сопоставление карты, текста, документа, находок требует того, чтобы все они говорили об одном месте и одном времени на едином языке (идентификаторы, координаты, даты). Без этого триангуляция разваливается на ручные «сводки». Теперь существуют стандартные справочники (gazetteer), временные онтологии, системы кодирования. Это позволило автоматизировать сопоставление.
Инфраструктура ответственности. Контрольные суммы, версии корпусов, конфигурационные файлы и журналы изменений создали инфраструктуру, при которой автор не может незаметно подогнать результат или утвердить, что он не знает, какие параметры использовал. Прежняя историография такой инфраструктуры не имела.
Сдвиг в культуре цитирования. Раньше ценилась великая монография, где один корифей излагал свою позицию. Теперь ценится репликуемый пайплайн, который независимая группа может поднять на своём компьютере, запустить и варьировать пороги. Это кардинально меняет стимулы авторов — им нужно быть честнее с параметрами.
5. Как исчезают типичные патологии
Патология 1: выборочное цитирование.
Автор приводит только те источники, которые его поддерживают, и молчит о противоречащих.
Решение в BT-REI: модель требует полноты кластера признаков. Пропущенный источник ослабляет апостериор. Рецензент может проверить: а какие источники в корпусе? Если есть противоречащий — почему его нет в модели?
Патология 2: телологические ретроспективы.
Автор смотрит на конец истории и потом задним числом переписывает её с целью оправдать этот конец.
Решение в IA-Δ: интервальные окна и допуски зафиксированы до анализа источников. Невозможно «подогнать» дату задним числом в рамках ограничений модели. Если факт не вписывается, это видно.
Патология 3: единственный канонический канал.
Все выводы опираются на один авторитетный источник (например, канонический церковный летопис), а остальные источники либо игнорируются, либо объявляются производными от него.
Решение в S³-DELTA: стресс-тест удаляет один канал и смотрит, рушится ли вывод. Если рушится — высокий SR, вывод хрупкий. Публикуется с жёлтым или красным статусом. Это давит на авторов в сторону мультиканальности.
Патология 4: методологический национализм.
Исследователи из разных стран используют разные национальные каноны как исходные точки. Им кажется, что они спорят об истории, на самом деле они спорят об исходных допущениях.
Решение в BT-REI с мультикорпусной трассировкой: модель вынуждает работать сквозь границы национальных традиций. Источники разных стран рассматриваются в единой системе координат (единое время, единая география, единая система идентификаторов). Национальные допущения становятся видны как параметры, а не как истины.
Патология 5: невоспроизводимость.
Автор пишет, что он сделал какое-то заключение. Но его процедуры скрыты, параметры неизвестны, данные недоступны. Рецензент не может повторить.
Решение в паспорте вывода: явно указываются IA-Δ-профиль (какие допуски), BT-REI-профиль (какие априоры, какие источники), S³-DELTA-профиль (какие стресс-тесты), версии корпусов, контрольные суммы. Рецензент скачивает архив, запускает код с теми же параметрами и получает идентичный результат. Если результат отличается, это техническая проблема, а не спор о методах.
6. Методологические характеристики научного подхода в S³-DELTA
Операциональность методологии
Операционализация процедуры реализуется через чёткую формализацию исследовательского процесса. Все этапы работы документируются и стандартизируются, что обеспечивает возможность их воспроизведения другими исследователями. В рамках методологии фиксируются:
- IA-Δ-окна как временные параметры анализа
- BT-REI-параметры как метрики оценки
- S³-DELTA-стрессы как механизмы проверки устойчивости результатов
Воспроизводимость результатов
Принцип воспроизводимости гарантирует получение идентичных результатов при повторении исследовательской процедуры на идентичных наборах данных с сохранением исходных параметров. Несоответствие результатов указывает на:
- Потенциальные ошибки в программном коде
- Проблемы с целостностью данных
- Необходимость дополнительной верификации методологии
Квантификация неопределённости
Количественная оценка результатов осуществляется через систему измеримых показателей:
- ΔC — метрика временного сдвига
- Post — показатель пост-обработки
- RF — фактор ранжирования
- SG — показатель значимости
- SR — коэффициент релевантности
Такая система исключает использование модальных конструкций и обеспечивает объективную оценку степени достоверности гипотез.
Критериальная фальсифицируемость
Принцип фальсифицируемости реализуется через предварительное определение условий, при которых результаты могут быть пересмотрены:
- Появление новых источников данных
- Корректировка допустимых параметров
- Неустойчивость результатов при стресс-тестировании
Методологическое преимущество
Данный подход существенно отличает цифровую историческую методологию от традиционной исторической полемики, где:
- Политические интерпретации трансформируются в проверяемые гипотезы
- Качественные оценки заменяются количественными параметрами модели
- Утверждения подвергаются строгой методологической проверке
Таким образом, S³-DELTA представляет собой комплексную методологическую систему, соответствующую фундаментальным критериям научности и обеспечивающую объективность исторического исследования.
7. Этика и управление рисками
Те же механизмы, которые снижают политизацию, задают и этические ограничения:
Публичность параметров. Все используемые параметры (допуски, априоры, пороги) публикуются вместе с результатами. Скрыть параметры невозможно.
Вариантные сценарии. В публикацию включаются не только результаты при выбранных параметрах, но и результаты при альтернативных параметрах. Если исследователь верит, что определённый источник надёжен на 90%, а не на 60%, то указываются результаты обоих вариантов.
Признание конкурирующих традиций. Если разные историографические школы (немецкая, французская, русская, китайская) предпочитают разные допущения, модель может быть запущена с допущениями каждой школы. Результаты — для каждой школы свои, но они сравниваемы.
Разделение коммуникаций. Консервативный отчёт публикуется для учебников. Исследовательское досье с жёлтыми и красными кейсами публикуется для специалистов. Это предотвращает путаницу между надёжным знанием и экспериментальными сценариями.
8. Практический регламент внедрения
Как на практике работают с методологией:
Шаг 1: до анализа.
Формулируется Δ-каркас: какие будут окна по датам, местам, названиям. Это обсуждается с коллегами и фиксируется в предварительном отчёте. До анализа конкретных источников.
Шаг 2: подготовка данных.
Собирается полный список признаков (дата, место, имя, маршрут, титулатура) и указываются для каждого источники. Для BT-REI фиксируются начальные вероятности (априоры) источников. Это тоже обсуждается и публикуется заранее.
Шаг 3: построение и тестирование.
Строится многослойный граф: текстовый (кто кого цитирует), географический (кто где), логистический (маршруты и сезонность), дипломатический (титулатура и правовые границы). Запускаются стресс-тесты S³-DELTA: удаление источников, блокировки путей, изменение параметров.
Шаг 4: публикация паспорта.
Выпускается паспорт вывода со статусом (зелёный/жёлтый/красный), версиями корпусов, контрольными суммами всех данных, параметрами конфигурации, результатами чувствительности.
Шаг 5: рецензирование.
Рецензент получает доступ к тому же архиву и конфигам. Запускает прогон на своём компьютере, убеждается, что результаты совпадают. Потом может запустить вариант с другими параметрами (иной допуск, иной априор) и видеть, как меняется результат. Расхождения обсуждаются как различие параметров, а не как «кто прав».
9. Границы применимости и добросовестное использование
Методы не заменяют традиционные дисциплины. Нужна работа с рукописными артефактами, почерковедение, локальная археология, дипломатический анализ. Три метода организуют пространство спора, но не исключают экспертизу.
В редких случаях методы честно указывают на неопределённость. Если корпус разрежен, если данных мало, если всё зависит от двух-трёх источников, то статусы смещаются в жёлтую или красную зону. Это не неудача методов. Это корректная фиксация неопределённости. Методы говорят: здесь нужны новые данные.
Добросовестное использование требует публикации неудачных кейсов. Если исследование показало, что гипотеза красная (отклонена), это нужно опубликовать. Публикация лишь зелёных результатов искажает картину.
10. Вывод
Политизация исторического знания поддерживалась тремя структурными причинами: дефицитом данных, непрозрачностью процедур и асимметрией авторитета.
Современная инфраструктура — сплошные оцифрованные корпусы, дешёвые вычисления, стандарты воспроизводимости — устранила первую причину.
Три метода — IA-Δ (интервальные окна), BT-REI (прозрачная триангуляция) и S³-DELTA (стресс-тесты устойчивости) — устранили вторую и третью причины.
История становится практикой вычислимых решений. Она имеет чёткие зоны применимости, открытые сценарии опровержения, явные пороги и воспроизводимые процедуры. Именно это отличает науку от риторики.
И ровно этого потребовалось, чтобы история смогла избежать судьбы инструмента политической легитимации и вернуться к своей подлинной задаче: пониманию того, как и почему прошлое было таким, каким оно было.
Автор методики — Руслан Абдуллин Р.