Найти в Дзене

«Ошибка выжившего» в генеалогии: откуда берётся и как бороться

Систематическая ошибка выжившего (англ. survivorship bias) — когнитивное искажение, при котором данные собраны только от «выживших» (тех, кто добился успеха) людей, а не от всех в анализируемой группе. В результате исследователи ищут закономерности среди «выживших» и упускают из вида, что не менее важная информация скрывается среди «погибших» (тех, у кого не получилось прийти к такому же результату). В генеалогии «ошибка выжившего» работает на полную катушку. Блоги коммерсов полны детективного глянца, достойного мисс Марпл: невероятных находок при минимальных зацепках, прорывов на 5 поколений за вечер, озарений, и так далее, всё, что мы так сильно любим. Тупики часто выведены за скобки, или скромно подвинуты в тень, упоминаются вскользь. Иногда они подаются читателю как некая экзотика, «особые случаи», которые получают своё описание уже после разгадки (если она, конечно, была). Подозреваю, что о многом такие блоги умалчивают. Более точно положение вещей можно оценить в генеалогических
Оглавление

Введение

Систематическая ошибка выжившего (англ. survivorship bias) — когнитивное искажение, при котором данные собраны только от «выживших» (тех, кто добился успеха) людей, а не от всех в анализируемой группе. В результате исследователи ищут закономерности среди «выживших» и упускают из вида, что не менее важная информация скрывается среди «погибших» (тех, у кого не получилось прийти к такому же результату).

В генеалогии «ошибка выжившего» работает на полную катушку. Блоги коммерсов полны детективного глянца, достойного мисс Марпл: невероятных находок при минимальных зацепках, прорывов на 5 поколений за вечер, озарений, и так далее, всё, что мы так сильно любим. Тупики часто выведены за скобки, или скромно подвинуты в тень, упоминаются вскользь. Иногда они подаются читателю как некая экзотика, «особые случаи», которые получают своё описание уже после разгадки (если она, конечно, была).

Подозреваю, что о многом такие блоги умалчивают.

Обратная сторона

Более точно положение вещей можно оценить в генеалогических чатах: здесь куда чаще можно встретить «погибших»; нет-нет да и раздается глас вопиющего с просьбой помочь. Но победные реляции очередного счастливчика всегда соберут больше лайков, чем «крики утопающих». Первые дают надежду на то, что «сможешь повторить». Вторые не дают ничего.

Мы ведь сами изучаем в основном предков, чьи линии дожили до нас, а «тупиковые» ветви (бездетные, рано умершие, пропавшие без вести) часто выпадают из семейной памяти. Так создаётся иллюзия про «могучее лихое племя» — хотя многим нашим предшественникам просто не повезло. В блогах так же: провальные поиски редко получают достойное описание. Какой же ты профи, если упёрся в стену? Себя нужно показывать в выгодном свете (особенно когда контент в твоём блоге выполняет рекламную функцию).

К чему я всё это?

  • Во-первых, чтобы на живых примерах показать, как эта ошибка бьет по реальному исследователю.
  • Во-вторых, чтобы приободрить: даже «глухари» могут стать источником полезной информации.

Хотя, если честно, последние пару недель я пребывал в скверном настроении. Виной тому не особо ободряющие результаты статистической обработки ревизий, и две ветви, на которые я возлагал большие надежды, но которые зашли в тупик. Об этом мой сегодняшний рассказ. Он послужит небольшим дополнением к предыдущему посту со статистикой. Рассмотрим два частных случая и общую картину по «потеряшкам» — крестьянским девушкам, вышедшим замуж (выданным в замужество) и после бесследно исчезнувшим. Тем, кого в ревизиях найти не удалось. Это те самые безмолвные «погибшие», канувшие в забвение.

Случай первый. Умершая невеста

Жил да был в 1782 году в селе Елфимове крестьянин Федор Ермолаев. Первая жена его умерла в 1772-м, и женился он второй раз на крестьянке села Василева Майдана, Авдотье (Евдокии) Авдеевой. Редкое отчество Авдотьи вселяло надежду на её успешный поиск в ревизии 1782 г. по Василеву.

Авдотья Авдеева в ревизии 1782 г. по с. Елфимово: ЦАНО ф.60 оп.239А д.54 л.443об.
Авдотья Авдеева в ревизии 1782 г. по с. Елфимово: ЦАНО ф.60 оп.239А д.54 л.443об.

Авдотья Авдеева — не просто редкое, а уникальное имя в наших краях! В Елфимове такая была одна — выше на картинке. И в Василеве тоже одна.

Вот она. Умершая в 1769 году.

Авдотья Авдеева в ревизии 1782 г. по с. Василево (Василев Майдан): ЦАНО ф.60 оп.239А д.54 л.715
Авдотья Авдеева в ревизии 1782 г. по с. Василево (Василев Майдан): ЦАНО ф.60 оп.239А д.54 л.715

Значит ли это, что в ревизии по Василеву допущена ошибка, и Авдотья на самом деле не умерла, а была выдана замуж?

Нет, не значит.

Достоверно подтвердить находку нельзя, и мы попали в бездоказательный тупик. Да, можно было бы предположить, что наша героиня не умерла, а была выдана в Елфимово. Но дальше этого предположения мы не продвинемся: метрических книг за нужный период в ЦАНО нет. Фиксируем тупик (как знать, может ещё метрики «всплывут»)? А дальше каламбур:

Случай второй. «Погибшая» из Погибелки

В том же Елфимове, в 1782 году, на листе 433об указана крестьянская дочь Ирина Максимова, выданная в село Михалково.

Ирина Максимова в ревизии 1782 г. по с. Елфимово: ЦАНО ф.60 оп.239А д.54 л.443об.
Ирина Максимова в ревизии 1782 г. по с. Елфимово: ЦАНО ф.60 оп.239А д.54 л.443об.

В свою очередь, в селе Михалково есть крестьянская жена Ирина Максимова, взятая из... Погибелки.

Ирина Максимова в ревизии 1782 г. по с. Михалково: ЦАНО ф.60 оп.239А д.54 л.663об.
Ирина Максимова в ревизии 1782 г. по с. Михалково: ЦАНО ф.60 оп.239А д.54 л.663об.

Но в Погибелке не было Ирины Максимовой, выданной замуж. Ошибка в ревизии по Михалкову? Но чем подкреплено такое предположение? Пустой ревизией по Погибелке? А если здешняя Ирина родом из соседнего Маресева, например? Там три тысячи душ: ищи-свищи. Или вовсе взята с воли? Редко, но бывало. Или из другой вотчины — тоже случалось.

Генеалогия требует доказательств. Здесь доказательств нет. Поэтому случай с Ириной тоже признан «потерянным». Про такие случаи в блогах обычно не говорят — зачем? Но их — пруд пруди. Не только в Елфимове, и не только в Нижегородской губернии. И не только у меня.

Те, кого найти нельзя

Описанная выше пара случаев — капля в море. Только в ревизии 1782 года по Елфимову таких «потеряшек» — 40 случаев на 195 браков. А после того, как я проверил соседние сёла вотчины, счёт перевалил за сотню. В масштабах уезда речь пойдет, очевидно, о тысячах потерянных девушек.

Что нам могут сказать «погибшие»? Данных для анализа у нас крайне мало: только имя и возраст. Тем не менее, попробуем вытащить из них хоть что-то. Построим гистограмму распределения возрастов «потерянных» девушек.

Количество «потеряшек» в зависимости от возраста (результат обработки ревизий 1782 г. по сёлам Елфимово, Василево, Кондрыкино, Михалково)
Количество «потеряшек» в зависимости от возраста (результат обработки ревизий 1782 г. по сёлам Елфимово, Василево, Кондрыкино, Михалково)

Видите два явных пика на возрастах 24 и 34 года и два «смазанных» пика на 29 и 39 лет? Мне они показались странными по двум причинам:

  • Шаг между пиками на гистограмме — 5 лет, что очень похоже на следы округления возраста.
  • Количество пропавших не должно находиться в явной корреляции с их возрастом.

Возможно, мы стали свидетелями системного искажения, которое, накладываясь на ошибки в именах, раз за разом приводило к потере человека в последующей ревизии. Далее мы попробуем развить эту мысль и придём к неожиданным выводам. А пока — краткое резюме:

Выводы:

  • Генеалогия — это не только опьяняющая радость от очередной находки, но и мужество принять «погибший кейс» как данность, сохраняя уважение к фактам и к тем предкам, чьи истории, увы, утрачены навсегда.
  • Соблазн «дотянуть» связь при слабой базе велик, но ведет к ошибкам. Хладнокровие и методологическая строгость важнее сиюминутного результата. Особенно важно: если исследование вам делает частник, и вы чувствуете, что доказательства слабы — настаивайте на дополнительных аргументах. Вы вправе это делать.
  • Делитесь опытом! Описывать тупики так же полезно, как и успехи. Это снимает глянец, помогает другим и нормализует сложности поиска. Мой сегодняшний рассказ — именно такая попытка.
  • И самое главное: попробуйте найти закономерности в собственных «глухарях». Может, они натолкнут вас на какую-нибудь важную мысль?