Найти в Дзене

Индексация метрических книг

Оглавление

Получив доступ к заветным метрическим книгам, хранящим всю информацию о моих предках до середины 19 века, я столкнулась с тем, что эту информацию из них нужно как-то добыть и систематизировать. Когда известен только год рождения предка с края временного диапазона, то потом остаётся только вручную перебирать все остальные года с предполагаемыми событиями: а когда был брак его родителей, а вдруг у них было много детей, где же их всех искать? Насколько близки к семье восприемники?

Без шуток, на такие детективные расследования можно потратить половину жизни, даже при наличии всех сохранившихся документов.

Индексация - процесс переписывания сведений из рукописного текста в структурированный печатный, доступный для быстрого анализа компуктерами.

Планы по автоматизации

Попытки изобрести свой велосипед, конечно же, были. Моей влажной мечтой было перенести все метрики в таблицы, а сами таблицы перенести в базы данных таким образом, чтобы по любой фамилии можно было автоматически нарисовать дерево связей. Но и читать глазами такой объём старого рукописного текста нерационально - я хотела найти нейросеть, которая уже это умеет. По иронии судьбы, спустя некоторое время такую нейросеть сделали сотрудники Яндекса - она используется для оцифровки Яндекс.Архивов. Труд это колоссальный, поэтому идею написать что-то подобное в одиночку я благоразумно отбросила. Но и в открытый доступ они её отдавать не собираются.

Первым делом Яндексы занимаются столичными документами, поэтому очередь до моих родных деревень вряд ли доберется при моей жизни. Так подумали многие люди и начали заниматься индексацией вручную. Так я узнала о том, что мои таблички - это детский лепет в мире, где люди очень серьезно занимаются генеалогией. Часть работы была существенна оптимизирована использованием индексаторов: модифицированные таблицы excel с поддержкой макросов. Добровольцы со всей страны кропотливо вписывают через них данные, а затем загружают на сайты в виде справочников.

У каждого в голове есть своя обученная нейросеть, но не очень мощная
У каждого в голове есть своя обученная нейросеть, но не очень мощная

Российский генеалогический сайт Familio

После того, как зарубежный популярный сайт MyHeritage помахал российским пользователям ручкой, я обнаружила, что и у нас есть достойные альтернативы. Конечно, путь предстоит долгий: допиливание сервисов, набор базы данных, создание мобильного приложение, умный поиск совпадений и т.д., но для поиска родственников на территории РФ этот сайт обещает быть незаменимым.

У Familio уже есть шаблоны индексаторов для самых разных документов: от исповедных росписей до ревизских сказок. Если частные инициативы совершенствуют индексаторы какой-то определенной тематики, например, метрические книги, то у сайта в каком-то виде индексаторы есть на каждый случай.

Здесь можно найти их перечень.

Мормонский уголок FamilySearch

Многие знают историю того, как у далеких-далеких друзей из-за большого моря оказались отечественные метрические книги со всей страны. Они были отсканированы и выложены в сеть. FamilySearch - это уже международный проект на базе, собранной мормонами. Есть только одна проблема - нам он не рад, поэтому все манипуляции по поиску информации и индексации на нем можно делать только через vpn. Зато там можно найти сведения по Украине, Казахстану и другим странам ближнего зарубежья, куда только могли дотянуться родословные корни.

Индексатор от Андрея

Совершенно случайно на просторах Дзена попалась рекомендация использовать некий индексатор от Андрея. Признает он только нативный MS Excel, отвергая все бесплатные аналоги редактирования таблиц наподобие LibreOffice. Немного помаявшись в думках, как им пользоваться, я прониклась тем, насколько это удобный и гибкий инструмент. Эти таблицы потом можно использовать и для целей своего анализа, и для загрузки в справочники Familio. Поддерживает он только метрические книги. Связаться с отцом этой приблуды можно в телеграм-канале Линии времени.

Интерфейс
Интерфейс

Каждое упомянутое лицо отправляется в список
Каждое упомянутое лицо отправляется в список

Я уже приступила к ленивой индексации метрических книг села Буйлово. Пока что свободного времени на это не так много. По-хорошему, о том, что я этим занялась, нужно где-то рассказать, чтобы несколько человек не делали одновременно одну и ту же работу, а распределили усилия. Но я пока не разобралась, где это сделать. Да и не похоже, что стоит очередь на то, чтобы этим заниматься.

Хобби
3,2 млн интересуются