Введение
Систематическая ошибка выжившего (англ. survivorship bias) — когнитивное искажение, при котором данные собраны только от «выживших» (тех, кто добился успеха) людей, а не от всех в анализируемой группе. В результате исследователи ищут закономерности среди «выживших» и упускают из вида, что не менее важная информация скрывается среди «погибших» (тех, у кого не получилось прийти к такому же результату).
В генеалогии «ошибка выжившего» работает на полную катушку. Блоги коммерсов полны детективного глянца, достойного мисс Марпл: невероятных находок при минимальных зацепках, прорывов на 5 поколений за вечер, озарений, и так далее, всё, что мы так сильно любим. Тупики часто выведены за скобки, или скромно подвинуты в тень, упоминаются вскользь. Иногда они подаются читателю как некая экзотика, «особые случаи», которые получают своё описание уже после разгадки (если она, конечно, была).
Подозреваю, что о многом такие блоги умалчивают.
Обратная сторона
Более точно положение вещей можно оценить в генеалогических чатах: здесь куда чаще можно встретить «погибших»; нет-нет да и раздается глас вопиющего с просьбой помочь. Но победные реляции очередного счастливчика всегда соберут больше лайков, чем «крики утопающих». Первые дают надежду на то, что «сможешь повторить». Вторые не дают ничего.
Мы ведь сами изучаем в основном предков, чьи линии дожили до нас, а «тупиковые» ветви (бездетные, рано умершие, пропавшие без вести) часто выпадают из семейной памяти. Так создаётся иллюзия про «могучее лихое племя» — хотя многим нашим предшественникам просто не повезло. В блогах так же: провальные поиски редко получают достойное описание. Какой же ты профи, если упёрся в стену? Себя нужно показывать в выгодном свете (особенно когда контент в твоём блоге выполняет рекламную функцию).
К чему я всё это?
- Во-первых, чтобы на живых примерах показать, как эта ошибка бьет по реальному исследователю.
- Во-вторых, чтобы приободрить: даже «глухари» могут стать источником полезной информации.
Хотя, если честно, последние пару недель я пребывал в скверном настроении. Виной тому не особо ободряющие результаты статистической обработки ревизий, и две ветви, на которые я возлагал большие надежды, но которые зашли в тупик. Об этом мой сегодняшний рассказ. Он послужит небольшим дополнением к предыдущему посту со статистикой. Рассмотрим два частных случая и общую картину по «потеряшкам» — крестьянским девушкам, вышедшим замуж (выданным в замужество) и после бесследно исчезнувшим. Тем, кого в ревизиях найти не удалось. Это те самые безмолвные «погибшие», канувшие в забвение.
Случай первый. Умершая невеста
Жил да был в 1782 году в селе Елфимове крестьянин Федор Ермолаев. Первая жена его умерла в 1772-м, и женился он второй раз на крестьянке села Василева Майдана, Авдотье (Евдокии) Авдеевой. Редкое отчество Авдотьи вселяло надежду на её успешный поиск в ревизии 1782 г. по Василеву.
Авдотья Авдеева — не просто редкое, а уникальное имя в наших краях! В Елфимове такая была одна — выше на картинке. И в Василеве тоже одна.
Вот она. Умершая в 1769 году.
Значит ли это, что в ревизии по Василеву допущена ошибка, и Авдотья на самом деле не умерла, а была выдана замуж?
Нет, не значит.
Достоверно подтвердить находку нельзя, и мы попали в бездоказательный тупик. Да, можно было бы предположить, что наша героиня не умерла, а была выдана в Елфимово. Но дальше этого предположения мы не продвинемся: метрических книг за нужный период в ЦАНО нет. Фиксируем тупик (как знать, может ещё метрики «всплывут»)? А дальше каламбур:
Случай второй. «Погибшая» из Погибелки
В том же Елфимове, в 1782 году, на листе 433об указана крестьянская дочь Ирина Максимова, выданная в село Михалково.
В свою очередь, в селе Михалково есть крестьянская жена Ирина Максимова, взятая из... Погибелки.
Но в Погибелке не было Ирины Максимовой, выданной замуж. Ошибка в ревизии по Михалкову? Но чем подкреплено такое предположение? Пустой ревизией по Погибелке? А если здешняя Ирина родом из соседнего Маресева, например? Там три тысячи душ: ищи-свищи. Или вовсе взята с воли? Редко, но бывало. Или из другой вотчины — тоже случалось.
Генеалогия требует доказательств. Здесь доказательств нет. Поэтому случай с Ириной тоже признан «потерянным». Про такие случаи в блогах обычно не говорят — зачем? Но их — пруд пруди. Не только в Елфимове, и не только в Нижегородской губернии. И не только у меня.
Те, кого найти нельзя
Описанная выше пара случаев — капля в море. Только в ревизии 1782 года по Елфимову таких «потеряшек» — 40 случаев на 195 браков. А после того, как я проверил соседние сёла вотчины, счёт перевалил за сотню. В масштабах уезда речь пойдет, очевидно, о тысячах потерянных девушек.
Что нам могут сказать «погибшие»? Данных для анализа у нас крайне мало: только имя и возраст. Тем не менее, попробуем вытащить из них хоть что-то. Построим гистограмму распределения возрастов «потерянных» девушек.
Видите два явных пика на возрастах 24 и 34 года и два «смазанных» пика на 29 и 39 лет? Мне они показались странными по двум причинам:
- Шаг между пиками на гистограмме — 5 лет, что очень похоже на следы округления возраста.
- Количество пропавших не должно находиться в явной корреляции с их возрастом.
Возможно, мы стали свидетелями системного искажения, которое, накладываясь на ошибки в именах, раз за разом приводило к потере человека в последующей ревизии. Далее мы попробуем развить эту мысль и придём к неожиданным выводам. А пока — краткое резюме:
Выводы:
- Генеалогия — это не только опьяняющая радость от очередной находки, но и мужество принять «погибший кейс» как данность, сохраняя уважение к фактам и к тем предкам, чьи истории, увы, утрачены навсегда.
- Соблазн «дотянуть» связь при слабой базе велик, но ведет к ошибкам. Хладнокровие и методологическая строгость важнее сиюминутного результата. Особенно важно: если исследование вам делает частник, и вы чувствуете, что доказательства слабы — настаивайте на дополнительных аргументах. Вы вправе это делать.
- Делитесь опытом! Описывать тупики так же полезно, как и успехи. Это снимает глянец, помогает другим и нормализует сложности поиска. Мой сегодняшний рассказ — именно такая попытка.
- И самое главное: попробуйте найти закономерности в собственных «глухарях». Может, они натолкнут вас на какую-нибудь важную мысль?