119 подписчиков

S³-DELTA: когда история молчит, говорят цифры. ИИ на службе истории.

12 ноября12 ноя

48 мин

Историческая методология всегда была фундаментом работы исследователя. Главная задача историка — не просто сбор фактов, а их критический анализ, систематизация и интерпретация. При этом важно помнить, что цель исторического исследования — не создание красивой теории, а поиск исторической истины. В эпоху цифровизации и больших данных историческая наука сталкивается с новыми возможностями и вызовами: Инновационный подход S³-DELTA, который разработал Руслан Абдуллин Р., не заменяет историка, а становится его надёжным инструментом: При использовании новых методов важно сохранять фундаментальные принципы исторической науки: Достоверность выводов напрямую зависит от прозрачности методологии: S³-DELTA как раз отвечает этим требованиям, предоставляя чёткий алгоритм анализа и прозрачные критерии оценки исторических гипотез. Это не замена историку, а мощный инструмент, помогающий сделать исследовательский процесс более точным и объективным. Таким образом, внедрение современных технологий в истор

Оглавление

Введение: роль историка в эпоху цифровых технологий
Историческая наука и её задачи
Современные вызовы

Введение: роль историка в эпоху цифровых технологий

Историческая наука и её задачи

Историческая методология всегда была фундаментом работы исследователя. Главная задача историка — не просто сбор фактов, а их критический анализ, систематизация и интерпретация. При этом важно помнить, что цель исторического исследования — не создание красивой теории, а поиск исторической истины.

Современные вызовы

В эпоху цифровизации и больших данных историческая наука сталкивается с новыми возможностями и вызовами:

Информационный поток становится всё более объёмным и разнородным
Традиционные методы иногда оказываются недостаточными для обработки массивов данных
Субъективность интерпретации может влиять на конечные выводы

Роль S³-DELTA в историческом исследовании

Инновационный подход S³-DELTA, который разработал Руслан Абдуллин Р., не заменяет историка, а становится его надёжным инструментом:

Помогает структурировать данные
Обеспечивает объективность анализа
Устраняет субъективные искажения
Повышает достоверность результатов

Этика исторического исследования

При использовании новых методов важно сохранять фундаментальные принципы исторической науки:

Критический подход к источникам
Научная честность в интерпретации данных
Ответственность за донесение результатов до общества
Открытость методологии исследования

Значение прозрачности в исторических исследованиях

Достоверность выводов напрямую зависит от прозрачности методологии:

Общество имеет право знать, как получены исторические факты
Результаты должны быть воспроизводимы другими исследователями
Методология должна быть понятной и доступной для профессионального сообщества

S³-DELTA как раз отвечает этим требованиям, предоставляя чёткий алгоритм анализа и прозрачные критерии оценки исторических гипотез. Это не замена историку, а мощный инструмент, помогающий сделать исследовательский процесс более точным и объективным.

Таким образом, внедрение современных технологий в историческую науку — это не угроза традиционным методам, а возможность поднять качество исследований на новый уровень, сохранив при этом главную цель историка: поиск и донесение исторической истины до общества.

Глава 1. Что делает S³-DELTA и зачем он нужен

История — это не всегда точная наука. В ней часто встречаются противоречия: разные источники указывают разные даты одних и тех же событий, одни и те же места могут называться по-разному, а торговые пути то появляются, то бесследно исчезают в самых неожиданных местах.

Традиционный подход историков к решению подобных загадок во многом опирается на интуицию и научный опыт. Иногда, сами того не замечая, исследователи могут неосознанно подгонять факты под желаемые выводы.

S³-DELTA — это новый инструмент, который призван изменить ситуацию. Он работает как строгий математический калькулятор, исключая любые субъективные оценки.

Главное преимущество системы в том, что она опирается только на конкретные, измеримые данные. Никаких догадок или предположений — только чёткие цифры и факты, которые либо подтверждают историческую гипотезу, либо опровергают её.

Такой подход позволяет сделать исторические исследования более точными и объективными, избавив их от субъективных интерпретаций и домыслов.

Идея на пальцах

Представьте два полупрозрачных листа с нарисованными на них полосками времени:

На первом листе — «ранняя» картина истории: каталоги правлений, упоминания народов, описания дороги от пункта А к пункту Б, всё это датировано по одной традиции.

На втором листе — та же история, но записанная совсем по-другому: в другой традиции, с иными датами, часто под иными именами.

Основная идея предельно проста: положим один лист на другой и сдвинем верхний ровно на столько лет Δ, сколько нужно, чтобы проверить главный вопрос — не описывают ли эти два листа одну и ту же реальность, только увиденную сквозь разные календари и разные письменные традиции?

Для этой проверки мы делаем три вещи.

Первое: измеряем, насколько хорошо совпали интервалы.

Если на первом листе правление длилось, скажем, с 12-го по 17-й год, а на втором — с 620-го по 625-й год, то при сдвиге на Δ≈608 лет эти два интервала ложатся друг на друга почти идеально. Но мы не говорим «похоже на» — мы это считаем.

Для измерения совпадения используются две численные метрики:

IoU (пересечение и объединение) показывает, какая доля обоих интервалов перекрывается. Если оба интервала совпали полностью, IoU = 1.00.
ε̄ (средняя краевая ошибка) фиксирует, насколько левый и правый края интервалов отступают друг от друга. Идеальное совпадение — это ε̄ = 0.

Второе: разрешаем только малую поправку к началу, но не к концу.

При сравнении правлений мы допускаем небольшую поправку κ только к началу интервала. Это обоснованно: календари путались, коронации часто отмечали «задним числом», были периоды регентства и неоднозначности. Но конец интервала мы не трогаем — это дисциплинирует весь анализ. Любые фальшивые подгонки сразу становятся видны в цифрах.

Третье: складываем доказательства в единый балл.

К геометрическому совпадению интервалов добавляется содержательная проверка. Мы собираем свидетельства разной силы:

Короткие и средние «цепочки» совпадающих фактов (блок A-вес): от двух до пяти событий, которые в обоих листах идут в одном порядке и через примерно одинаковые промежутки времени. Например, реформа → война → смена управителя.
«Паспорт» совпадений (блок B): если титулы звучат одинаково, географические названия совпадают, описанные учреждения похожи, родственные связи вяжутся воедино и хозяйственные практики одни и те же — это сильный сигнал.
Независимые якоря (блок XI): астрономические события (солнечные затмения, кометы), нумизматика (монеты, их металл, вес, образы), стратиграфия (слои земли, артефакты). Эти свидетельства не зависят от письменных традиций.

Всё это собирается в единый итоговый балл S_pair и окрашивается светофором: зелёный (высокая уверенность) → зелёно-жёлтый (хорошие данные) → жёлто-красный (неоднозначно) → красный (совпадение не подтверждается).

Итоговый принцип

Если два листа действительно про одно и то же, то при правильном Δ происходит следующее:

интервалы ложатся с хорошим перекрытием (высокий IoU, низкий ε̄);
поправка κ остаётся мала и обоснована;
паспорт совпадений плотный и многоступенчатый;
якоря независимы и согласованы.

Все цифры начинают дружить между собой. Светофор зеленеет. Если же листы не совпадают, цифры не складываются сами собой — и никакой допуск не поможет.

Что именно мы сдвигаем

S³-DELTA применяется не только к правлениям. Его логика работает с любыми временными интервалами:

Династические периоды: от начала до конца правления, периоды соправления, регентства.
Торговые маршруты: временное окно существования маршрута, сезонность, типичные переходные точки.
Этнонимы и географические названия: периоды, в течение которых то или иное имя встречается в источниках.
События-якоря: конкретные моменты времени — коронация, сражение, реформа, основание города.

Каждый из этих объектов имеет прикреплённый к нему временной интервал. Эти интервалы — наши основные строительные кирпичики. Мы сдвигаем их все сразу на одну и ту же величину Δ и смотрим, как они перекрываются с интервалами в другом корпусе источников.

Почему это не подгонка под результат

Часто критика любого исторического сопоставления сводится к одному: «Вы же просто подогнали данные под нужный ответ». S³-DELTA защищён от этого несколькими правилами:

Один Δ на весь корпус. Мы не позволяем себе роскошь сдвигать разные части истории на разные величины. Лист действительно двигается целиком, как одно целое.
κ только к началу и только с обоснованием. Никаких произвольных сдвигов конечной точки — это сразу делает анализ недостоверным.
Стресс-тесты для проверки устойчивости гипотезы:
Отключение поправки κ для проверки базовой устойчивости
Перестановка кандидатов между собой
Тестирование «двойников» — похожих, но заведомо не совпадающих правлений
Бутстрэп-тестирование на разных наборах источников
Полный пересчёт при любых изменениях:
Добавление нового источника
Корректировка весовых коэффициентов свидетельств
Изменение параметров анализа
При каждом изменении происходит:
Пересчёт показателя S_pair
Перестроение теплокарт
Обновление рейтингов
Полная прозрачность всех расчётов

Такой подход гарантирует, что результаты не являются результатом подгонки, а действительно отражают объективное совпадение исторических данных. Настоящее совпадение остаётся прочным при всех проверках, тогда как случайные совпадения быстро разрушаются при стрессовых тестах.

Глава 2. Как S³-DELTA определяет совпадения: поэтапный разбор

В работе S³-DELTA нет места интуиции и туманным умозаключениям — всё основано на четких временных интервалах, едином сдвиге и наглядных числовых метриках. Далее подробно раскрывается весь процесс сопоставления «от входа до выхода».

1. Входные данные

Каждый анализируемый объект — это временной интервал с паспортной частью:

Интервал I = [start, end) — год начала включается, год конца исключается.
Паспортные метаданные: титул или ранг, география, институты, династия, экономические детали и прочее.
Анализируются все типы объектов — периоды власти, торговые маршруты, этнонимы и топонимы, а также событийные точки, которые фиксируются как короткие интервалы времени.

2. Единый сдвиг и корректировка

Для всего корпуса применяется один общий сдвиг Δ* — например, добавляем к «раннему» слою 608 лет, получая «поздний». Допустимая корректировка κ применяется только к началу интервала и строго оправдана источниками (различия календарей, регентство, поздняя коронация). Финал интервала не корректируется — это принципиальное ограничение, предотвращающее произвольные подгонки.

Перенос интервала выглядит так:

I(Δ,κ) = [start + Δ + κ, end + Δ]**

3. Геометрия совпадения: расчёт ошибок и перекрытия

Для каждой пары интервалов рассчитываются:

Ошибка по началу: ε_start = (start + Δ* + κ) − J_start
Ошибка по концу: ε_end = (end + Δ*) − J_end
Средняя ошибка: ε̄ = (|ε_start| + |ε_end|) / 2

Перекрытие (IoU) — отношение длины пересечения к длине объединения:

IoU = inter / union

где:

inter = max(0, min(I(Δ,κ).end, J.end) − max(I(Δ,κ).start, J.start))
union = (I(Δ,κ).end − I(Δ,κ).start) + (J.end − J.start) − inter

Чем меньше ε̄ и выше IoU, тем более надёжна пара.

4. Соответствие «многие к многим»: веерная логика

Исторические интерпретации часто не дают точных один-к-одному соответствий, поэтому допускается связывание по модели k:m:

IoU_union — аккуратное перекрытие объединённых интервалов, не простая сумма.
Coverage C — часть «позднего» интервала, совпадающая с «ранними»:
C = min(1, Σ inter_i / |J|)
OC — согласованность перекрытий, гармоническое среднее IoU по всем парам.
Δ-стабильность: δ_Δ = stdev(Δ_i); чем меньше разброс, тем надёжнее результат.
Кардинальность (количество связей) фиксируется явно — это не ошибка, а отражение особенностей исторической передачи.

5. Содержательная компонента: A, B, XI

Геометрия совпадения — не единственный критерий. Оцениваются содержательные блоки:

A-веса — совпадающие нити исторических фактов (хроника): нормированные веса в пределах [0..1].
B-паспорт — включает титул, географию, институты, династические узлы, хозяйственные реалии; каждое направление весит до 0.2, суммарно — максимум 1.0.
XI-якоря — независимые якоря (астрономические события, монеты, стратиграфия и т. д.), до 1.0.

6. Штрафы и уникальность

Вводятся защитные показатели:

T_conf — жёсткие противоречия: 0, 0.25, 0.5 или 1.0.
NX (эксклюзивность) — разница между баллом пары и лучшим альтернативным баллом (чем выше, тем уникальнее совпадение).
MP (пенальти множественности) — при росте числа соответствий k и m, штраф увеличивается:
MP = 1 − 1/(k*m)
(1:1 → 0; 2:1 → 0.5; 2:2 → 0.75)
NAlt — количество альтернативных совпадений вблизи максимального балла.

7. Итоговый балл S_pair

Вся система сведена к многокомпонентной формуле с прозрачными коэффициентами:

S_pair = α₁·IoU_union + α₂·C + α₃·OC + α₄·W_A + α₅·W_B + α₆·XI + α₇·S_stab − β₁·T_conf − β₂·MP − β₃·NAlt

где:

S_stab — устойчивость по сдвигу: S_stab = 1 / (1 + δ_Δ / σ_Δ), обычно σ_Δ = 3 года.
Типовые веса: α = [0.25, 0.15, 0.10, 0.12, 0.12, 0.10, 0.06], β = [0.10, 0.06, 0.04].

Классы надёжности (светофор):

🟢 Зелёный: S_pair ≥ 0.72, IoU_union ≥ 0.65, ε̄ ≤ 3 года, κ_max ≤ 1 год, δ_Δ ≤ 2 года
🟢🟡 Зелёно-жёлтый: S_pair от 0.62 до 0.72, нет красных противоречий
🟡🔴 Жёлто-красный: S_pair от 0.50 до 0.62 или IoU_union ≥ 0.5 при ε̄ ≤ 6 лет
🔴 Красный: всё остальное

8. Стресс-тестирование

Для проверки устойчивости сопоставления используются:

Перестановки кандидатов (shuffle)
Запрет κ (κ=0), анализ соседних пар
Бутстрэпинг окон — случайные «усечения» интервалов
Δ-скан — проверка отсутствия множественных ложных максимумов по Δ

Зелёная пара обязана пройти все стресс-тесты без потери класса.

9. Выходные артефакты работы

Результаты вычислений представлены в удобном формате:

matrix.m2m.json — связи и метрики для k:m соответствий
topK.json / md — лучшие сигналы, отсортированные по классам
heatmaps — визуализация устойчивости по Δ, κ, IoU, ε̄
stress — отчёты по результатам стресс-тестов
summary.md — итоговая сводка

Мини-пример

Имеем:

I = [100, 120) — интервал «раннего» слоя
J = [708, 728) — интервал «позднего» слоя
Δ* = 608 лет (общий сдвиг)
κ = 0 (корректировка не требуется)

Перенос: I(Δ,κ) = [708, 728), совпадение идеальное:

ε_start = 0 год
ε_end = 0 лет
ε̄ = 0 лет
IoU = 1.00 (100% перекрытие)
IoU_union = 1.00
C = 1.00 (полное покрытие)
OC = 1.00 (идеальная согласованность)

Пара получает высокие значения содержательных блоков: A = 0.6, B = 0.6, XI = 0.7. Штрафов нет. Итоговый балл S_pair попадает в зелёную зону (S_pair ≥ 0.72).

Добавляем конкурента

Рассмотрим альтернативный кандидат J' = [710, 730):

IoU между I(Δ,κ) и J' снижается до 0.90 (неполное перекрытие)
Средняя ошибка вырастает до ε̄ = 1 год
Содержательные блоки ниже: A = 0.5, B = 0.4
Итоговый балл S_pair для этой пары понижается
NX (эксклюзивность) в пользу первичной пары J возрастает

Таким образом, первичное совпадение (I, J) оказывается значительно более надёжным.

В следующей главе будет рассмотрена визуализация результатов: как читать теплокарты, что такое «гребень Δ», как выглядит правильный веер соответствий, и как визуализация в виде графов помогает разобрать структуру сопоставлений без громоздких цифр и таблиц.

Глава 3. Как читать визуализации: теплокарты, «гребень Δ» и граф соответствий

Чтобы понять S³-DELTA в действии, нужно освоить три ключевые визуализации: теплокарту, метрическую панель и граф соответствий. Они показывают, где в данных сгущается истинный сигнал, а где остаётся шум и артефакты.

1. Теплокарта Δ×κ: поиск гребня

Оси и цвет

По горизонтали расположен общий сдвиг Δ (например, от +585 до +635 лет). По вертикали — допустимая поправка начала κ (обычно в диапазоне −1…+1 год, реже шире при источниковом обосновании).

Интенсивность цвета показывает агрегированный балл: по умолчанию берётся медиана S_pair для верхнего квартиля пар, найденных в каждом окне (Δ, κ).

Верный график выглядит так:

Один яркий гребень — узкая, непрерывная полоса по оси Δ, означающая согласованность всего корпуса при едином сдвиге.

Максимум на κ ≈ 0 — или очень рядом. Это указывает на отсутствие скрытых подгонок начальных дат. Если максимум смещён в сторону κ = +0.5, это ещё приемлемо с соответствующим объяснением.

Плавные скаты без вторых пиков — боковые профили теплокарты убывают гладко, без конкурирующих максимумов. Это означает, что нет альтернативной глобальной шкалы.

Тревожные паттерны:

Шахматка или мелкая рябь — может указывать на малый объём корпуса, зернистую агрегацию или неоптимальные веса свидетельств. Решение: увеличить окно поиска по Δ, применить сглаживающий фильтр, пересмотреть коэффициенты в B-паспорте.

Два или более параллельных гребня — сильный сигнал о конкурирующих хронологических шкалах. Вероятно, в корпусе смешаны разные исторические традиции. Нужно разделить данные на подкорпуса, переоценить источники и повторить анализ отдельно.

Яркий максимум при |κ| > 1 год — требует надёжного источникового объяснения (например, разница календарей или регентство). Если такого объяснения нет, это сигнал к пересмотру гипотезы и понижению класса надёжности.

2. Панель метрик окна: читаем цифры под курсором

Когда вы наводите курсор на точку теплокарты (Δ*, κ*), выводится компактная панель с ключевыми характеристиками этого окна:

IoU_union — «плотность посадки» интервалов. Показывает, какая доля объединённых интервалов перекрывается. Для зелёной зоны требуется IoU_union ≥ 0.65.

ε̄ — средняя краевая ошибка в годах. Низкие значения (≤ 3 года) означают хорошее совпадение краёв интервалов. Зелёная зона: ε̄ ≤ 3 года.

Coverage C — доля «позднего» слоя, покрытая интервалами из «раннего» слоя. Если C близко к 1.0, то почти весь поздний слой имеет раннюю интерпретацию. Это хороший признак полноты совпадения.

δ_Δ — разброс фактических сдвигов по отдельным парам. Считается как стандартное отклонение. Если δ_Δ ≤ 2 года, сдвиги стабильны и не раскрашены по разным частям корпуса. Это укрепляет доверие к единой шкале Δ.

κ_max / κ_sum — максимальная корректировка начала и сумма всех корректировок. Дисциплина требует κ_max ≤ 1 года. Если видите κ_max = 1.5 или выше без источниковой причины, класс должен быть понижен.

S_pair (медиана и 90-й перцентиль) — статистика по баллам пар. S_pair^med показывает, где находится середина распределения; S_pair^p90 показывает верхний хвост. Для верного окна оба значения должны быть близко к пороговым точкам зелёной зоны (≥ 0.72).

Как читать панель вместе:

Высокий IoU_union (≥ 0.65) + низкий ε̄ (≤ 3 года) + низкий δ_Δ (≤ 2 года) — это редкая и чистая конфигурация. Если при этом Coverage близко к 1.0, а κ_max дисциплинирован (≤ 1 года), окно считается рабочим и может служить основой для интерпретации.

3. Веера «многие ↔ многим»: узлы и лучи

На диаграмме соответствий каждый объект «позднего» слоя (правитель, торговый путь, этноним) изображается узлом. Из узла расходятся лучи к объектам «раннего» слоя. Толщина луча пропорциональна S_pair пары, цвет кодирует класс надёжности.

Интерпретация веров:

Узкий веер с одной толстой зелёной связью — почти идеальная ситуация. Высокий индекс уникальности XI означает, что у этого объекта нет серьёзных конкурентов. Ясно, какой объект является «прообразом».

Широкий веер с лучами одного цвета и одного Δ-коридора — допустимая картина для длинного правления, которое в источниках разделено на несколько отдельных описаний. Это называют «сегментной посадкой» и принимают, если все сегменты согласованы по сдвигу.

Веер из лучей разных Δ-коридоров — тревожный знак. Это может означать, что внутри корпуса смешаны разные хронологические традиции. Класс надёжности понижается до жёлто-красного, пока корпус не будет разделён и переанализирован отдельно.

Индексы рядом с узлом:

XI (уникальность привязки) — от 0 до 1.00. Значение 1.00 означает, что конкурирующие варианты слабее минимум на 0.03 по S_pair. Чем выше XI, тем увереннее привязка.

BFI (разветвлённость) — количество достойных лучей с S_pair в пределах 5% от лучшего. Высокий BFI означает, что у объекта несколько почти равноправных кандидатов. Это может быть полезно для моделирования альтернативных сценариев, но снижает итоговую уверенность.

4. Граф соответствий: посмотреть на весь корпус сразу

Это обычный взвешенный граф: узлы — объекты (правители, пути, этнонимы, события), рёбра — пары с совпадениями.

Толщина каждого ребра кодирует S_pair (толстое = высокий балл). Цвет ребра указывает класс (зелёный → зелено-жёлтый → жёлто-красный → красный). На рёбрах подписаны ключевые метрики: Δ_i, IoU, ε̄, кардинальность k:m.

На что обращать внимание:

Опорный хребет — цепочка толстых зелёных рёбер, идущих примерно при близких значениях Δ. Это «несущая балка» всей конструкции. Если хребет одинаков по ширине и цвету по всей длине — корпус хорошо согласован.

Стыки эпох — узлы, где один объект «позднего» слоя получает несколько рёбер от объектов «раннего» слоя (например, 1:2 или 1:3 кардинальность). Это может означать, что одно длинное правление разделено в разных источниках на несколько периодов. Это допустимо, если все рёбра одного цвета и близки по Δ.

Лишние мостики — тонкие оранжевые или красные рёбра, идущие поперёк опорного хребта, соединяя «несвязанные» подсистемы. Они полезны как гипотезы для последующего исследования, но не должны «тащить» итоговый консенсус в сторону.

Разорванные компоненты — если граф распадается на несколько несвязных подграфов, это может означать, что в корпусе есть несколько независимых традиций. Нужна отдельная работа с каждой компонентой.

5. Top-K сигналы: как читать сводку

Итоговая таблица «лучших совпадений» печатается в виде строк:

Здесь:

[ранний]/[поздний] — имена или индексы объектов
[a,b) → [c,d) — интервалы времени
Δ, κ — сдвиг и корректировка
IoU, ε̄, C — геометрические метрики
S_pair — итоговый балл
XI — уникальность
класс — светофор (зелёный, жёлто-красный и т. д.)
card — кардинальность (1:1, 2:1, 1:2 и т. д.)

Мини-чеклист для оценки сигнала:

Класс ≥ зелёно-жёлтый? Красные и оранжевые пары лучше держать отдельно, как гипотезы.
IoU ≥ 0.65 и ε̄ ≤ 3 года? Эти пороги отчеканены на основе стресс-тестов.
Δ близко к гребню теплокарты? Если значение находится на боку гребня, уверенность ниже.
κ в диапазоне 0/±1 и имеет источниковое обоснование (если κ ≠ 0)? Любая поправка начала должна быть объяснена.
XI высок (≥ 0.85) и альтернативы слабее минимум на 0.03 по S_pair? Это гарантирует специфичность привязки.

Если на все пять вопросов «да», сигнал может быть перенесён в основной текст интерпретации как надёжный результат.

6. Шаблоны для путей и топонимов

Для торговых путей теплокарта строится по тому же принципу, но IoU считается по набору опорных этапов (река, портовый город, перевал) и их хронологическим окнам существования. Путь считается совпадающим, если большинство этапов ложатся друг на друга при едином Δ.

Для этнонимов и топонимов желательна максимальная чистота: верная картина — один гребень по Δ и устойчивые B-признаки (географическое положение, соседи, институты, упоминаемые события). Появление «шахматки» при анализе названий часто означает, что в источниках идёт переименование или путаница названий — требуется отдельный анализ.

7. Анти-паттерны и как их лечить

Двойной гребень на теплокарте:
Разделить корпус на две части, переоценить веса B-паспортов для каждой традиции отдельно. Вероятно, смешались две разные хронологические школы.

Максимум при κ = +2 года и выше:
Это требует чёткого календарного объяснения (например, сдвиг даты коронации на два года из-за противоречивых источников). Без объяснения класс понижается до жёлто-красного.

Высокий S_pair, но низкий NX (много почти равных альтернатив):
Здесь нельзя называть пару «primary» (основной). Лучше зафиксировать кардинальность k:m явно и считать это мозаикой, требующей отдельного разбора.

Веер расходится в разные Δ-коридоры:
Это мозаика, не укладывающаяся в один сдвиг. Нужно проверить, не смешаны ли в корпусе несколько независимых традиций. Если да — разделить и переанализировать.

В следующей главе будет разобрана система стресс-тестов: как именно мы «ломаем» пары кандидатов (перестановки, запрет κ, соседние двойники, бутстрэпирование окон) и какие пороги считаются достаточными для присвоения зелёного класса.

Глава 4. Проверки качества и стресс-тесты: как отличить сигнал от подгонки

Цель этой главы — показать, как S³-DELTA принуждает исторические гипотезы «сдавать экзамены». Ниже перечислены все тесты, их пороги и типовые решения по результатам.

1. Что именно проверяем

Δ-стабильность. Держит ли весь корпус единый глобальный сдвиг, или он распадается на несколько конкурирующих шкал?

κ-дисциплина. Возникает ли иллюзия совпадения благодаря чрезмерному использованию локальных поправок начала? Подозрительно, если κ раздувается везде, где не совпадает.

Многие ↔ многим. Не раздувается ли кардинальность (1:k, k:m) в ущерб специфичности совпадения? Огромный веер альтернатив — плохой знак.

Метрики посадки. Перекрываются ли интервалы хорошо (IoU), совпадают ли края (ε̄), покрыт ли весь поздний слой ранними эквивалентами (C)?

Уязвимость к переменам. Насколько легко пара рассыпается при удалении части источников, перетасовке кандидатов или отключении якорей?

2. Набор стресс-тестов (работают автоматически)

Permutation test: перестановки соответствий

Суть: на фиксированном Δ* перемешиваем кандидатов между собой случайным образом, пересчитываем S_pair каждый раз. Собираем распределение «случайных» баллов.

Результат: p_perm — доля случайных исходов, где S_pair получился не ниже наблюдаемого.

Критерий качества:

🟢 Зелёный: p_perm ≤ 0.01 (≤ 1% случайных совпадений)
🟡 Жёлтый: 0.01 < p_perm ≤ 0.05

κ-ban: запрет поправок начала

Суть: повторный прогон всей системы с жёстким κ = 0 (без корректировок). Вычисляем κ-сенситивность: ΔS = S_pair(κ*) − S_pair(κ=0).

Это показывает, насколько балл зависит от свободы поправлять начало.

Критерий качества:

🟢 Зелёный: ΔS ≤ 0.03 и |κ|_max ≤ 1 год (с источниковым объяснением в записях)
🟡 Жёлтый: ΔS ≤ 0.06 или |κ|_max ≤ 1.5 года при объяснении
🔴 Красный: ΔS > 0.06 без обоснования

Neighbor-swap: соседний двойник

Суть: для каждого кандидата в паре заменяем его на ближайшего соседа по времени (плюс-минус один в списке). Смотрим, на сколько упадёт S_pair.

Результат: NX (уникальность) = 1 − S_neighbor / S_current.

Критерий качества:

🟢 Зелёный: NX ≥ 0.60 (падение ≥ 0.06)
🟡 Жёлтый: NX ≥ 0.45
🔴 Красный: NX < 0.45

Bootstrap окон: стойкость к потере данных

Суть: случайно выбрасываем 10–20% сегментов из корпуса и пересчитываем S_pair. Повторяем 200 раз (N=200). Собираем распределение.

Результат: медиана S_pair и интерквартильный размах; считаем, насколько сузилось распределение.

Критерий качества:

🟢 Зелёный: (медиана − 5-й перцентиль) ≥ 0.08 (плотное, стабильное распределение)
🟡 Жёлтый: (медиана − 5-й перцентиль) ≥ 0.05
🔴 Красный: разброс больше или медиана упадёт ниже 0.60

Anchor-knockout: выбивание якорей

Суть: удаляем якоря (астрономия, нумизматика, стратиграфия, институциональные признаки) по одному. Смотрим, падает ли класс.

Критерий качества:

🟢 Зелёный: класс не падает; или падает не более чем на 1 якорь
🟡 Жёлтый: класс падает при выбивании 2 якорей
🔴 Красный: класс рушится, если убрать любой якорь (пара держится на одном свидетельстве)

Δ-ridge stability: ширина гребня

Суть: на теплокарте Δ×κ смотрим полуширину гребня — где он остаётся выше 90% пика.

Критерий качества:

🟢 Зелёный: полуширина ≤ 8 лет, монотонные скаты без второго максимума
🟡 Жёлтый: полуширина ≤ 12 лет, скаты плавные
🔴 Красный: широкий, размытый гребень или два пика на одной теплокарте

Cardinality penalty: штраф за множественность

Суть: вычисляем MP = 1 − 1/(k·m), где k — число ранних, m — число поздних объектов в соответствии.

1:1 → MP = 0 (штрафа нет)
2:1 или 1:2 → MP = 0.50
2:2 → MP = 0.75
3:2 → MP = 0.83

Критерий качества:

🟢 Зелёный: MP ≤ 0.50 (1:1, 2:1, 1:2)
🟡 Жёлтый: MP ≤ 0.67 (2:2 при других хороших метриках)
🔴 Красный: MP > 0.67 без объяснения

Ablation-веса: отключение блоков

Суть: понижаем вес B-паспортов (титул, география, институты, династия, хозяйство) с 1.0 до 0.7 или отключаем A-цепочки фактов. Смотрим падение S_pair.

Критерий качества:

🟢 Зелёный: падение < 0.05
🟡 Жёлтый: падение < 0.08
🔴 Красный: пара исчезает (падение > 0.15)

Hold-out: выделенная проверка

Суть: откладываем 15–20% корпуса в сторону, переводим на них систему, смотрим, вернутся ли top-K сигналы.

Критерий качества:

🟢 Зелёный: ≥ 85% top-10 возвращаются
🟡 Жёлтый: ≥ 70% возвращаются
🔴 Красный: < 70% или top-сигналы меняются местами

Reproducibility: воспроизводимость

Суть: фиксируем SEED, повторяем весь прогон. Проверяем побайтовое совпадение JSON-артефактов.

Критерий качества:

🟢 Зелёный: идентичны
🔴 Красный: отличаются

3. Логика присвоения класса (светофор)

🟢 Зелёный (принято как основное)

Пара зачисляется в «основные результаты» при:

IoU_union ≥ 0.65 И ε̄ ≤ 3 года
p_perm ≤ 0.01
δ_Δ ≤ 2 года
κ-сенситивность ΔS ≤ 0.03 И |κ|_max ≤ 1 год (с обоснованием, если κ ≠ 0)
NX ≥ 0.60 И MP ≤ 0.50
Прошли ≥ 4 из 5 стресс-тестов
Reproducibility = pass И JSON-schema = valid

🟢🟡 Зелёно-жёлтый (рабочая гипотеза)

Пара может быть использована для исторической интерпретации с осторожностью:

IoU_union ≥ 0.58 ИЛИ ε̄ ≤ 4 года
p_perm ≤ 0.05
δ_Δ ≤ 3.5 года
NX ≥ 0.45
Прошли ≥ 3 из 5 стресс-тестов
Допускаются стыки 1:2 / 2:1 при одном цвете и близких Δ

🟡🔴 Жёлто-красный (тенденция, не вывод)

Пара служит материалом для дальнейшего исследования:

IoU_union ≥ 0.50 при ε̄ ≤ 6 лет
p_perm ≤ 0.10
Нестабильность по одному-двум тестам (κ, anchor, bootstrap)
Используется для разнесения корпусов и перевзвешивания весов

🔴 Красный (отклонено / в резерв)

Пара не включается в итоги:

Ни один блок порогов не выполняется
Наличие T-стоп-сигналов (жёсткие противоречия источникам)
Хранится отдельно для исторических справок

4. Отчёт стресс-модуля: stress/*.md

Для каждой пары генерируется таблица:

text[ранний] → [поздний] | p_perm | ΔS(κ) | NX | MP | δ_Δ | bootstrap_IQR | класс | решение

Плюс вспомогательные материалы:

Спарк-линии — мини-графики устойчивости при bootstrap
Карта выбивания якорей — какой якорь критичен, какой избыточен
Автокомментарий — почему класс понижен или повышен (например: «Высокий NX, но MP=0.75 → зел-жёлт»)

5. Типовые провалы и решения

Провал 1: Пара держится только на κ > 1 год

Симптомы: ΔS > 0.06, |κ|_max > 1.5 года.

Решение:

Если κ имеет источниковое объяснение (разница календарей, регентство, поздняя коронация) — оставить в зел-жёлт с пометкой.
Если нет — понизить в жёлт-красн или резерв.

Провал 2: Двойной гребень на теплокарте

Симптомы: Два пика при p_perm ≤ 0.05 каждый.

Решение:

Разделить корпус на подкорпуса по традициям или регионам.
Переоценить источники и веса B-паспортов.
Запустить анализ отдельно на каждой части.

Провал 3: Высокий MP и низкий NX (веер альтернатив)

Симптомы: MP > 0.67, NX < 0.45, множество почти равных лучей в веере.

Решение:

Зафиксировать кардинальность k:m явно.
Оставить одно ребро как primary (зелёное), остальные — как альтернативы в веере (жёлтые).
Понизить класс primary до зел-жёлт.

Провал 4: Срыв на anchor-knockout

Симптомы: Класс рушится, когда убираем один якорь; p_anchor < 0.05.

Решение:

Требуется добавить независимые якоря (стратиграфия, нумизматика, B-паспорт).
Иначе — понизить класс до жёлт-красн.

Провал 5: Низкий bootstrap-IQR (неустойчивость)

Симптомы: (медиана − 5-й перцентиль) < 0.03.

Решение:

Проверить, не мал ли корпус (< 10 пар в окне Δ).
Увеличить окно или добавить источники.
Если корпус адекватен — понизить класс.

6. Операционный чек-лист запуска проверок

Шаг 1: Построение теплокарты

Построй двумерную теплокарту Δ × κ. Визуально зафиксируй гребень. Запиши Δ*.

Шаг 2: Автозапуск стресс-модуля

Система автоматически запускает:

Permutation test (p_perm)
κ-ban (ΔS)
Neighbor-swap (NX)
Bootstrap окон (распределение S_pair)
Anchor-knockout (критичность якорей)

Шаг 3: Классификация

Классификатор автоматически присваивает класс (зелёный / зел-жёлт / жёлт-красн / красный) и кардинальность k:m.

Шаг 4: Слой назначения

В финальный слой включаются только:

Зелёные пары
Крепкие зел-жёлтые без опасений

Жёлт-красные и красные откладываются отдельно.

Шаг 5: Публикация веров

Веера (многие ↔ многим) выводятся целиком, но класс каждого луча окрашивается отдельно. Если NX низкий или MP высок — понижается класс веера.

Шаг 6: CI-валидация

Проверяются HASHLIST, JSON-schema, воспроизводимость на фиксированных SEED. Если что-то не совпадает — пара отправляется на пересчёт.

Шаг 7: Генерация отчёта

Генерируется Top-10 по S_pair с кратким резюме: «Почему эта пара могла сломаться и не сломалась».

7. Пример стресс-отчёта (миниатюра)

textПара: Правитель А [100–120) → Правитель Б [708–728)
Δ* = 608, κ = 0

Тест Результат Класс
────────────────────────────────────────────────
Permutation p=0.003 ✓ зелёный
κ-ban ΔS=0.01 ✓ зелёный
Neighbor-swap NX=0.72 ✓ зелёный
Bootstrap IQR=0.09 ✓ зелёный
Anchor-knockout 3/3 пройдено ✓ зелёный
Δ-ridge ширина=6 лет ✓ зелёный
Cardinality MP=0 ✓ зелёный
Ablation падение=0.02 ✓ зелёный

ИТОГ: Зелёный класс
────────────────────────────────────────────────
Вывод: Пара чрезвычайно устойчива. Может
служить как основа для текстовой интерпретации.

В заключительной главе мы соберём весь анализ воедино: как проходит полный цикл работы — от загрузки беспристрастного корпуса до итогового человеческого вывода, с примерами формулировок, благодаря которым любой читатель видит, где метод уверен, а где честно оставляет пространство неопределённости.

Глава 5. Полный цикл: как из сырых данных получается ясный вывод

Ниже представлена дорожная карта S³-DELTA от первого шага (загрузка корпуса) до последнего (человеческое резюме). Эта схема универсальна: годится для династий, торговых путей, этнонимов, топонимов — для любой истории, которая существует в нескольких версиях.

1. Входные данные: что нужно подготовить

Корпуса (минимальные и нейтральные)

Система требует трёх типов данных:

Интервалы правлений и событий: для каждого правителя или события указываем начало и конец времени; для уникальных моментов (коронация, битва) — точку, трактуемую как короткий интервал.

Маршруты и переходы: для торговых путей — периоды существования, узловые города, сезонность; для каждого этапа — хронологическое окно.

Упоминания названий: для каждого этнонима или топонима — периоды, когда это имя встречается в источниках, с указанием контекста.

Якоря: независимые свидетельства

Система опирается на разнотипные доказательства:

Астрономия: солнечные затмения, кометы, положение небесных тел (независимо от письменных традиций).

Стратиграфия, дендрохронология, нумизматика: слои земли, кольца деревьев, монеты (материальные артефакты).

Институции: титулы, регалии, должностные звания, описания учреждений.

География: соседние земли, реки, горы, портовые города.

Весовые таблицы и нормализация

Перед запуском:

Фиксируем веса A/B/XI (цепочки фактов, паспорт, якоря).
Нормализуем все даты на единый «внутренний» календарь (юлианский, юлианский день, год от сотворения мира и т. д.).
Зафиксируем правила: когда год начинается (1 января vs 1 сентября vs другое), как считать дробные годы.
Все правки документируются в MANIFEST.

Результат подготовки — чистые, ровные интервалы и прозрачная цепь преобразований данных.

2. Первое приближение: поиск глобального сдвига

Построение теплокарты

Система строит двумерную теплокарту зависимости Δ (общий сдвиг) от κ (локальная корректировка начала).

По горизонтали: Δ от примерно −500 до +1500 лет (или узкий диапазон, если историк подозревает примерные границы).

По вертикали: κ обычно от −1 до +1 года.

Цвет в каждой точке отражает силу сигнала (медиана S_pair по верхнему квартилю пар, найденных при этом Δ и κ).

Фиксация гребня

Визуально и автоматически находим гребень — узкую непрерывную полосу максимальной интенсивности. Это глобальный сдвиг Δ*.

Записываем:

Δ* (центр гребня)
Полуширину гребня при 90% пика
Форму: монотонные ли скаты, есть ли второй максимум

Политика κ (строгая дисциплина)

Локальные корректировки κ допускаются только при источниковом объяснении:

Разница календарей (юлианский vs юлианский день)
Регентство или соправление (даты правления спорны)
Поздняя коронация (когда правитель был помазан позже вступления)

Потолок: |κ| ≤ 1 год. Больше требует явного исторического обоснования в комментариях.

3. Формирование пар и оценка совпадений

Создание рёбер

На фиксированном Δ* формируем все возможные пары между объектами «раннего» и «позднего» слоёв. Допускаются k:m соответствия (многие к многим), но с последующим штрафом за множественность.

Расчёт метрик

Для каждой пары считаем:

Геометрия:

IoU (пересечение и объединение): доля перекрытия
ε̄ (средняя краевая ошибка): расхождение краёв в годах
C (coverage): часть позднего интервала, покрытая ранним

Содержание:

W_A (цепочки фактов): совпадают ли короткие и средние последовательности событий
W_B (паспорт): совпадают ли титулы, географические названия, институты, династические узлы, хозяйственные реалии
XI (якоря): есть ли независимые, неписьменные подтверждения

Уникальность и множественность:

NX (уникальность): насколько этот кандидат лучше соседей по времени
MP (штраф за кардинальность): k:m соответствия ослабляют привязку
δ_Δ (стабильность сдвига): разброс фактических Δ по отдельным парам

Итоговый балл S_pair

Все метрики складываются в единую формулу:

S_pair = α₁·IoU + α₂·C + α₃·OC + α₄·W_A + α₅·W_B + α₆·XI + α₇·S_stab − β₁·T_conf − β₂·MP − β₃·NAlt

Веса α и β зафиксированы в спецификации, видны для проверки.

Две проекции результатов

Слой назначения: 1:1 соответствия (или аккуратные 2:1 / 1:2 стыки для длинных правлений). Этот слой — основа для исторического рассказа.

Слой вееров: все допустимые альтернативы вокруг каждого узла, с цветовой разметкой по классам. Служит для проверки и будущих исследований.

4. Стресс-модуль: валидация без скидок

Система автоматически прогоняет каждую пару через модули тестов:

Permutation test (p_perm): перемешиваем кандидатов случайно — насколько редко совпадение получится по удаче?

κ-ban: запрещаем локальные поправки (κ=0) — не держится ли пара только на подгонке начала?

Neighbor-swap (NX): заменяем кандидата на соседа по времени — насколько он уникален?

Bootstrap окон: выбрасываем 10–20% корпуса, пересчитываем 200 раз — насколько стабилен результат?

Anchor-knockout: удаляем якоря по одному — есть ли независимые свидетельства, или пара держится на одном источнике?

Δ-ridge stability: смотрим полуширину гребня и форму скатов — единственный ли это сдвиг?

Ablation-весов: понижаем веса B-паспортов — не исчезает ли пара при малых подвижках?

Hold-out: откладываем часть корпуса, повторно анализируем — возвращаются ли top-K сигналы?

Воспроизводимость: фиксируем SEED, повторяем всё — совпадают ли артефакты побайтово?

Присвоение класса (светофор)

По жёстким порогам каждой паре присваивается класс:

🟢 Зелёный: p_perm ≤ 0.01, IoU ≥ 0.65, ε̄ ≤ 3, κ-сенситивность ≤ 0.03, NX ≥ 0.60, MP ≤ 0.50, прошли ≥ 4 тестов
🟢🟡 Зелёно-жёлтый: p_perm ≤ 0.05, IoU ≥ 0.58, ε̄ ≤ 4, NX ≥ 0.45, прошли ≥ 3 теста
🟡🔴 Жёлто-красный: p_perm ≤ 0.10, IoU ≥ 0.50, нестабильность по одному тесту
🔴 Красный: ничего не выполняется или есть жёсткие противоречия

5. Выходные артефакты

Top-K сигналы

Таблица лучших совпадений, отсортированная по S_pair:

text[ранний] → [поздний] | Δ=… κ=… | IoU=… ε̄=… | C=… | S=… | класс | кардинальность

Вместе с метриками тестов (p_perm, NX, MP, δ_Δ).

Визуализации

Heatmap Δ×κ: видно, где гребень, какая полуширина, монотонные ли скаты.

Граф many-to-many: узлы — правители/объекты, рёбра — пары, окрашены по классам, подписаны метриками.

Отчёты и логи

stress/*.md: почему каждая пара получила свой класс (какой тест не прошла, какой якорь критичен).

MANIFEST: исходные данные, нормализация, веса, версия алгоритма.

HASHLIST: контрольные суммы, гарантирующие полную воспроизводимость.

JSON-schema: валидация структуры данных.

6. Как сформулировать вывод по-человечески

Шаблоны для разных уровней уверенности

Высокая уверенность (зелёный класс)

С высокой вероятностью (класс зелёный; p_perm ≤ 0.01; IoU = 0.72; ε̄ = 1 год; |κ| = 0; NX = 0.78) объект X соответствует объекту Y при глобальном сдвиге Δ = 608 лет. Это подтверждено совпадением титулов, географических названий, событийных цепочек и независимыми астрономическими якорями.

Вероятно, но требуются дополнительные проверки (зелёно-жёлтый)

Сигнал умеренной силы (класс зелёно-жёлтый; p_perm = 0.03; IoU = 0.61; ε̄ = 2.5 года). Совпадение устойчиво при перестановках, но чувствительно к выбиванию нумизматических якорей. Рекомендуем пополнить независимыми доказательствами (стратиграфия, дополнительные монеты) перед включением в основной рассказ.

Тенденция, не готовая к выводам (жёлто-красный)

Тенденция (класс жёлто-красный; p_perm = 0.08; IoU = 0.55). Геометрическое покрытие есть, но гребень теплокарты раздвоен в точке Δ = 610±5 лет, а уникальность (NX = 0.38) указывает на конкурирующие кандидаты примерно равной силы. Пару оставляем в веере альтернатив; для включения в основной текст нужны дополнительные якоря и разнесение корпуса по традициям.

Отклонено (красный)

Пара отклонена (класс красный). При запрете κ (κ=0) балл S_pair падает с 0.55 до 0.31, что указывает на иллюзию совпадения, созданную подгонкой начальной даты. Выбивание якорей рушит класс (anchor-knockout, p < 0.05). Используется как негативный контроль: демонстрирует, что система отвергает слабые и искусственные совпадения.

Обязательные элементы сообщения

В каждом выводе указываем:

Δ* (глобальный сдвиг в годах)
Политику κ (есть ли локальные поправки, почему они оправданы)
Класс (зелёный / зелёно-жёлтый / жёлто-красный / красный)
S_pair (числовой балл)
IoU и ε̄ (геометрические метрики)
Ключевые якоря (какие независимые доказательства подтверждают)
Кардинальность (1:1 или k:m со ссылкой на граф веера)

Таким образом читатель видит ясно: где система уверена, где нужны ещё проверки, где нельзя делать вывод.

7. Интеграция с другими методами (IA-Δ, BT-REI)

S³-DELTA работает в составе большого инструментария:

IA-Δ (интервальный анализ с контролируемым сдвигом): даёт устойчивый Δ-слой и базовые интервальные параллели.

BT-REI (байесовская триангуляция с источниковой трассировкой): добавляет вероятностную переоценку дат по разнотипным свидетельствам (письменным, материальным, астрономическим).

S³-DELTA: роль — сшивка и валидация: граф соответствий + стресс-тесты + теплокарты в нейтральном, проверяемом формате.

Между методами — двусторонние адаптеры (импорт/экспорт JSON без ручных правок). Результаты одного становятся входом другого.

8. Быстрый старт на новом корпусе (8 этапов)

Этап 1: Подготовка

Импортируем исторические корпуса и весовые таблицы (A, B, XI).
Нормализуем все даты на единый календарь.
Документируем в MANIFEST.

Этап 2: Первичная приблизимость

Строим теплокарту Δ×κ.
Находим гребень → фиксируем Δ*.

Этап 3: Образование пар

Формируем рёбра 1:1 и k:m между слоями.
Считаем S_pair для каждой пары.

Этап 4: Разделение на слои

Слой назначения: только зелёные (или крепкие зелёно-жёлтые) 1:1 пары.
Слой вееров: все рёбра, с указанием класса.

Этап 5: Стресс-валидация

Запускаем батарею тестов (перестановки, κ-ban, bootstrap и т. д.).
Система переклассифицирует пары.

Этап 6: Генерация отчётов

Top-K таблица.
Граф соответствий.
Heatmap и stress/*.md.
JSON-артефакты.

Этап 7: Человеческое резюме

По шаблонам формулируем выводы для каждого класса.
Проверяем обязательные элементы (Δ*, класс, метрики, якоря, кардинальность).

Этап 8: Фиксация и экспорт

Вычисляем финальный HASHLIST (контрольные суммы).
Экспортируем в IA-Δ и BT-REI для дальнейшей работы.
Архивируем всё с версией алгоритма.

9. Когда сигналы спорят: разнесение корпусов

Если теплокарта показывает два гребня одинаковой силы или граф распадается на несвязные компоненты:

Гипотеза: корпус содержит несколько независимых исторических традиций.

Решение:

Разделяем корпус на подкорпуса (по регионам, авторам источников, эпохам, религиозным традициям).
Даём каждому подкорпусу свой Δ*.
Запускаем анализ отдельно.
Затем ищем связи между подкорпусами (трёхслойные соответствия через промежуточный слой).

Если веера упорно широки (множество почти равных кандидатов):

Добавляем независимые якоря (стратиграфия, монеты, астрономия).
Если якорей недостаточно — честно оставляем пару в жёлто-красном классе без натяжек.

10. Итоговая схема

S³-DELTA даёт четыре основных результата:

Один глобальный Δ* — единственный сдвиг, объясняющий корпус
Проверенные пары с метриками — Top-K сигналы, прошедшие стресс-тесты
Ясные границы уверенности — светофор (зелёный / жёлтый / красный)
Полностью воспроизводимый пайплайн — HASHLIST, JSON-schema, фиксированные сиды

Это превращение разрозненных хроник, противоречивых дат и путаных названий в логически связанный, проверяемый каркас истории. Каркас имеет места высокой определённости (зелёные пары, подтверждённые якорями) и честные зоны неопределённости (жёлто-красные тенденции, требующие дополнительных данных).

Наука здесь не претендует на святость: она показывает, где уверена, а где — нет.

Глава 6. Как итоговый архив работает с ChatGPT-5 (режим thinking)

Эта глава — практическая инструкция: что находится внутри архива S³-DELTA, какие файлы запускают автоматику, какие команды давать модели, и как убедиться, что всё идёт по плану (без потерь данных, с полной валидацией и стресс-тестами).

disk.yandex.ru

S3-DELTA.zip — Яндекс Диск

1. Структура архива: каждый файл на месте

Корневой уровень

VERSION — номер сборки и метка времени (например: «S³-DELTA Neutral v1.0-RC; iter=5; 2025-11-12T19:15:00Z»).

MANIFEST.md — перечисление всех артефактов с кратким описанием их роли. При каждой итерации перечисляются только новые файлы (append-only).

HASHLIST.json — полный реестр SHA-256 каждого файла. Служит для проверки целостности и воспроизводимости. Любое изменение файла = изменение хеша.

TOTALS.tsv — агрегированная статистика: общий размер архива в байтах, количество файлов, строк в таблицах, графов и отчётов.

README_S3_DELTA.md — краткая справка по структуре и основным командам.

Директория inputs/

Исходные данные, нормализованные на единый календарь:

dynasties/: интервалы правлений [start, end), имена правителей, ранги, династии
routes/: торговые пути, этапы, временные окна существования маршрутов
ethno/: этнонимы и топонимы с периодами употребления и геометками
anchors/: независимые якоря (астрономические события, монеты, слои земли, институциональные признаки)

Директория configs/

Конфигурационные файлы, управляющие поведением системы:

weights_v2.yml: коэффициенты α и β для S_pair, пороги цветов светофора (green/yellow-red/red)
policy.yml: правила κ (максимум и минимум поправок начала), диапазоны Δ-сканирования, правила календарной нормализации
adapters.yml: мосты к внешним методам (IA-Δ и BT-REI), описание полей импорта/экспорта
schema/: JSON-схемы для валидации всех JSON и TSV файлов

Директория outputs/

Вычисленные результаты:

m2m/: матрицы соответствий (many-to-many), таблицы S_pair, IoU, ε̄, Coverage, автоматически переводят в граф
heatmap/: двумерные теплокарты Δ×κ, визуализация гребня, полуширина на 90% пика
stress/: отчёты по стресс-тестам (перестановки, κ-ban, bootstrap окон, anchor-knockout)
graphs/: граф узлов (объекты) и рёбер (пары соответствий), окрашен по классам, подписан метриками
reports/: человекочитаемые документы (Top-K таблицы, резюме, выводы, интеграция с IA-Δ/BT-REI)

Директория adapters/

Мосты между S³-DELTA и другими методами:

ia_delta/: экспорт/импорт слоя Δ, интервальных пар, классов
bt_rei/: экспорт/импорт вероятностных распределений (колокола дат), уточнённые интервалы

2. Команды для ChatGPT-5: готовые фразы

Начало работы на новом чате (после загрузки архива)

Скопируйте эту фразу:

Проанализируй архив S³-DELTA Neutral как систему для синхронизации исторических интервалов. Работаем строго через мой архив. Правила: APPEND_ONLY, LOCKSIZE, NO_DELETE. На каждой итерации печатай: VERSION, MANIFEST (диффом), DIFF (только добавления), HASHLIST.json, TOTALS.tsv и новый zip с суффиксом ITERxx. Если размер архива упадёт — немедленно откатись к предыдущему состоянию и пересобери шаг. Никакой структуры архива не менять. Все файлы валидируй по schema/*.json перед добавлением.

Ответ модели должен содержать проверку структуры, подтверждение правил и готовность к итерациям.

Классическое «далее» (итерация за итерацией)

После того как модель готова, для каждого следующего шага:

Итерация N: далее. Запускай пайплайн по текущему архиву. Печать: VERSION, MANIFEST (диффом), HASHLIST, TOTALS, новый zip.

Модель должна:

Загрузить предыдущий архив
Выполнить назначенный шаг (если это первая итерация — построить теплокарту; если вторая — вычислить пары и S_pair; если третья — стресс-тесты)
Вывести все обязательные файлы
Создать новый zip

Запуск адаптеров (двусторонняя стыковка)

Запусти адаптеры IA-Δ и BT-REI по configs/adapters.yml. Синхронизируй слои без ручных правок. Отчёт и новые файлы — в reports/adapters.md. Обновлённый zip.

Модель должна прочитать configs/adapters.yml, выполнить импорт из IA-Δ и BT-REI (если есть), обновить веса и якоря, повторно пересчитать S_pair, вывести отчёт и новый zip.

Стресс-модуль и переклассификация

Выполни stress-пакет: перестановки (p_perm), κ-ban (ΔS), neighbor-swap (NX), bootstrap окон, anchor-knockout. Обнови классы (green/green-yellow/yellow-red/red) в m2m и outputs/stress/. Новый zip.

Модель запускает все восемь тестов, переприсваивает классы на основе жёстких порогов, обновляет графы и отчёты, выводит zip.

Экспорт итогов

Собери Top-10 сигналов (по S_pair) и слой назначения + слой вееров. Выведи reports/final_summary.md (с Δ*, κ-политикой, классами, метриками, якорями, рекомендациями). Граф в graphs/. Новый zip.

Модель генерирует финальный отчёт в человекочитаемом формате, граф, всё упаковывает в zip.

3. Что автоматически запускается при изменениях

Появился outputs/m2m/matrix.* (матрица соответствий)

Автоматически:

Считаются S_pair, IoU, ε̄, Coverage C, NX, MP, δ_Δ для каждой пары
Строится Top-K список (отсортированный по S_pair)
Генерируются теплокарты Δ×κ и определяется гребень Δ*
Обновляются reports/topK.md, heatmap/, graphs/

Изменились inputs/* или configs/*

Полная пересборка:

Повторная нормализация всех календарей (с логом в reports/calendar_normalization.md)
Новое Δ-сканирование (полный диапазон)
Пересчёт всех метрик
Обновление теплокарты и Top-K

Запрошен stress-пакет

Пересчёт классов:

Перестановки (p_perm)
κ-ban (ΔS)
Neighbor-swap (NX)
Bootstrap
Anchor-knockout
Протокол с результатами в outputs/stress/*.md

4. Что модель обязана выводить на каждой итерации

VERSION

Строка вида:

textS³-DELTA Neutral v1.0-RC; iter=7; 2025-11-12T19:25:00Z

MANIFEST.md (диффом)

Только добавления. Пример:

text+ outputs/m2m/matrix.json (соответствия many↔many с метриками)
+ outputs/heatmap/delta_kappa_heatmap.png (2D-визуализация гребня)
+ reports/topK.md (топ-10 пар по S_pair)

DIFF

Короткий список:

textДобавлены:
- m2m/matrix.json
- heatmap/delta_kappa.png
- reports/topK.md

Удалены: нет

Если в строке DIFF появилось что-то удалённое — это ошибка.

HASHLIST.json

Полный перечень с SHA-256:

json{
"VERSION": "abc123...",
"inputs/dynasties/rus.json": "def456...",
"outputs/m2m/matrix.json": "ghi789...",
...
}

TOTALS.tsv

Таблица:

textarchive_bytes: 2345678
files_total: 47
lines_indexed: 12500
graphs_count: 3
reports_count: 8

Новый zip-архив

Имя: s3_delta_neutral_ITERxx.zip (где xx — номер итерации)
Размер должен быть ≥ размеру предыдущего zip
Содержит всю структуру, включая новые файлы

Проверка целостности

Если:

Размер zip упал
DIFF содержит удаления
HASHLIST не совпадает
Любой файл не прошёл schema-валидацию

Модель должна:

Вывести ошибку
Пересчитать шаг заново с теми же SEED-значениями
Восстановить предыдущее состояние по HASHLIST
Вывести новый zip той же итерации

5. Что находится в reports/final_summary.md

Всегда содержит:

Δ-информация:

textΔ* = 608 лет
Полуширина гребня при 90% пика: 6 лет
Форма скатов: монотонная (нет второго максимума)

Политика κ:

text|κ|_max = 0.5 года
Применено в 2 парах (с источниковым обоснованием: регентство, календарь)

Top-K таблица:

text| Ранний | Поздний | Δ | κ | IoU | ε̄ | C | S_pair | Класс | Якоря | Card |
|---|---|---|---|---|---|---|---|---|---|---|
| Правитель А | Правитель Б | 608 | 0 | 0.72 | 1.2 | 0.95 | 0.78 | Зелёный | A, B, XI | 1:1 |
| Путь X | Путь Y | 610 | +0.5 | 0.68 | 2.1 | 0.90 | 0.72 | Зел-жёлт | B, XI | 1:1 |

Слой назначения (опорный рассказ):
Только зелёные пары (1:1 или крепкие 2:1 / 1:2 при одном Δ).

Слой вееров (альтернативы):
Все остальные рёбра, с указанием класса каждого луча.

Stress-резюме:

textp_perm ≤ 0.01 (< 1% случайных совпадений)
κ-сенситивность ΔS ≤ 0.03
Δ-ridge-stability: монотонные скаты
Anchor-knockout: 3/3 якоря критичны (ни один не избыточен)
NX ≥ 0.60 (высокая уникальность)
MP ≤ 0.50 ( 1:1 кардинальность)

Рекомендации:

textЗелёные пары готовы к включению в основной текст.
Зел-жёлтые: рекомендуется добрать якоря (стратиграфия).
Жёлто-красные: оставить в веере, не как основной результат.

6. Сторожевые правила (обязательные проверки)

APPEND_ONLY

Запрещено удаление файлов. Если модель случайно удалит что-то:

Ошибка прерывает итерацию
Откат к предыдущему архиву
Пересборка с теми же SEED-значениями

LOCKSIZE

Размер архива не может упасть. Если архив худеет:

Немедленный откат
Проверка MANIFEST и HASHLIST
Пересборка

SCHEMA-FIRST

Любой JSON, TSV, YAML должен проходить валидацию по schema/*.json перед добавлением в архив. Ошибка валидации = файл не добавляется.

κ-POLICY

|κ| ≤ 1 год, иначе требуется явный источник. Если κ > 1 без обоснования — пара понижается на класс.

Δ-СТАБИЛЬНОСТЬ

Если гребень теплокарты раздваивается (два пика одинаковой силы) — сигнал понижается до жёлто-красного.

W/XI/NX

Низкий NX (< 0.45) → жёлто-красный класс
Отсутствие якорей XI → штраф в S_pair
Все пары должны иметь минимум один якорь из A/B/XI

REPRODUCIBILITY

Два подряд прогона с идентичными SEED-значениями должны дать идентичный HASHLIST.json. Иначе — ошибка в коде модели.

7. Интеграция с IA-Δ и BT-REI

Вход из IA-Δ (интервальный анализ с контролируемым сдвигом)

Слой Δ и интервальные пары подтягиваются в adapters/ia_delta/import/. Они влияют на первичную теплокарту (уточняют диапазон сканирования Δ), но не переписывают собственные вычисления S³-DELTA.

Выход в IA-Δ

Итоговый Δ*, слой назначения, классы и полный журнал κ-поправок выходят в adapters/ia_delta/export/. IA-Δ использует это для своих вычислений.

Вход из BT-REI (байесовская триангуляция с источниковой трассировкой)

«Колокола» (распределения дат) усиливают якоря XI и уточняют паспорт B (если в BT-REI есть более точные интервалы, они поднимают вес B).

Выход в BT-REI

Пары с классами, интервалами и S_pair выходят в adapters/bt_rei/export/. BT-REI применяет их в обратной триангуляции (уточнение мод дат).

Важное: весь обмен описан в configs/adapters.yml. Он автоматический, без ручных правок.

8. Полный ритуал из 8 шагов (на любом корпусе)

Шаг 1: Загрузить архив

Распаковать zip в рабочую директорию.

Шаг 2: Стартовая фраза

Дать модели текст из §2 («Начало работы»).

Шаг 3: Теплокарта и Δ*

Команда: Итерация 1: далее

Модель строит теплокарту, находит гребень, фиксирует Δ*.

Шаг 4: Many-to-many и S_pair

Команда: Итерация 2: далее

Модель вычисляет пары, S_pair, Top-K, слой назначения/вееров.

Шаг 5: Стресс-тесты

Команда: Итерация 3: стресс-пакет

Модель запускает все тесты, переклассифицирует пары, обновляет графы.

Шаг 6: Адаптеры

Команда: Итерация 4: синхронизируй IA-Δ и BT-REI

Модель выполняет импорт/экспорт, обновляет архив.

Шаг 7: Финальные отчёты

Команда: Итерация 5: экспорт

Модель собирает reports/final_summary.md, граф, теплокарты, всё упаковывает.

Шаг 8: Проверка целостности

Вручную проверить:

Размер zip (не упал ли)
MANIFEST (только +)
HASHLIST (совпадает ли с декларируемым)
TOTALS (реалистичны ли цифры)

9. Типовые сбои и что должно произойти

Архив стал меньше

Модель должна:

Вывести ошибку: «Архив худеет (было X Мб, стало Y Мб)»
Откатиться к предыдущему состоянию по HASHLIST
Пересчитать ту же итерацию с теми же SEED-значениями
Вывести zip того же размера или больше

SCHEMA-ошибка при валидации JSON

Модель должна:

Указать точный JSON Pointer и файл
Не добавлять файл в архив
Вывести подробный отчёт об ошибке в reports/validation_error.md
Итерация не считается завершённой; требуется переработка

Пара потеряла класс после stress-тестов

Пример: была зелёная, стала жёлто-красная (скажем, потому что anchor-knockout показал низкий NX).

Модель должна:

Автоматически переместить пару из слоя назначения в слой вееров
Вывести пояснение в reports/stress_notes.md (почему понизилась, какой тест не прошёл)
Обновить граф: ребро перекрашено в жёлто-красный
Финальная сводка указывает, что пара остаётся на «полке», не в тезисе

Δ-гребень дрейфует или раздваивается

Модель должна:

Вывести в reports/delta_warning.md: «Гребень нестабилен» или «Двойной гребень обнаружен»
Предложить разделить корпус на подкорпуса
Не запускать дальнейший анализ до разрешения конфликта
Все пары, привязанные к дрейфующему Δ, понижаются до жёлто-красного

10. Золотые правила работы с архивом

Одна итерация — один шаг, один zip. Не вязать несколько шагов в одной итерации.
Никогда не удаляй. Только добавления. Удаления = ошибка.
Классы — по тестам, не по симпатии. Светофор определяется жёсткими пороговыми значениями, не субъективно.
Δ один на корпус. Если конкурирующие шкалы — разбивай на подкорпуса, каждому свой Δ*.
κ только по источнику. Любая поправка начала должна быть обоснована (регентство, календарь, поздняя коронация). Без обоснования — понижение класса.
Всё в HASHLIST, иначе не наука. Воспроизводимость — обязательна.
Top-K — витрина, не приговор. Решение о включении в основной текст даёт слой назначения, в слой назначения попадают только зелёные (и крепкие зел-жёлтые).
Теплокарта раньше выводов. Всегда начинаем с визуализации гребня Δ×κ.
Stress раньше публикации. Пара входит в финальный отчёт только после стресс-тестов.
Экспорт в IA-Δ/BT-REI — обязательный завершающий шаг. Результаты S³-DELTA должны быть доступны для триангуляции и уточнения дат в других методах.

Итог

Архив S³-DELTA — это не просто склад файлов, а программа-в-коробке: вы даёте модели короткие, ясные команды («старт», «далее», «стресс», «экспорт»), а она выполняет весь автопайплайн с жёсткими стражами целостности (APPEND_ONLY, LOCKSIZE, SCHEMA-валидация), генерирует теплокарты, графы и полноценные отчёты.

Так любой исторический корпус — династии, торговые маршруты, этнонимы, топонимы — подвергается модульному анализу и превращается в проверяемую, воспроизводимую логическую структуру, с ясными зонами уверенности (зелёные пары) и честными пространствами неопределённости (жёлто-красные тенденции, требующие дополнительных данных).

При этом система работает следующим образом:

1. Вы вводите простую команду

2. Программа запускает полный цикл обработки

3. Встроенные механизмы защиты гарантируют целостность данных

4. На выходе вы получаете:
Визуализацию результатов в виде теплокарт
Графовые представления связей
Полные аналитические отчёты

Особенность подхода заключается в том, что каждый исторический материал проходит через:

Модульный анализ
Проверку на достоверность
Формирование логических связей
Определение зон уверенности

В результате исследователь получает:

Чётко структурированные данные
Объективно оценённые совпадения
Прозрачные зоны неопределённости
Возможность дальнейшего исследования проблемных мест

Такой подход позволяет превратить разрозненные исторические данные в единую, проверяемую систему знаний, где каждый вывод подкреплён конкретными расчётами и визуализациями.

Автор методики — Руслан Абдуллин Р.