Найти в Дзене

Индексатор для метрических книг за 10 секунд с помощью нейросети

Оглавление

Уже не первый год я хотела собрать базу персон по селу Русская Буйловка, используя опубликованные архивом документы. Пока я лелеяла свои планы, люди изобрели индексацию: волонтеры день и ночь переписывают имена и фамилии из желтых неразборчивых страниц в печатные буквы. Нет универсального инструмента для этого занятия, но дальше всех ушли в Familio. Собственно, именно они и внесли смысл в процесс индексации, как единое хранилище для всей информации.

В качестве инструмента и Familio, и некоторые энтузиасты традиционно предлагали модифицированные таблицы Excel. Признаюсь, мне стало лень с ними разбираться, да и многим пожилым людям, которые имеют и силы, и время, и желание индексировать - тоже не стали. Им это тоже сложно. А понятной программы с графическим интерфейсом не завезли.

Для себя я писала скрипты, чтобы максимально ускорить и упростить обработку данных, но кроме меня мало кто может их использовать. Для моих целей этого более, чем достаточно: я все еще не добралась до перевода своих таблиц в формат справочника Familio, но написала обработчики и генераторы справочников по метрическим книгам. Ну, просто мне это было интереснее.

В какой-то момент я начала разбираться, как переложить свои скрипты на графический интерфейс, и это дело завязло. У меня маленький ребенок, который не дает много времени на хобби, и процесс идет очень уж медленно.

Но тут я решила попробовать натравить на свои задачи китайскую нейросеть DeepSeek - и за, буквально, 10 секунд она мне выдала заветное приложение, которое я хотела. Не без небольших косяков, но годное и функциональное.

Суть работы в том, что программа перегоняет введенные данные в таблицу Excel в том виде, в котором я ее использую потом для генерации справочников и обновления сводной таблицы персон. Когда-нибудь и для Familio сделаю, да-да...

Не буду плакать о своей некомпетентности, просто поделюсь первой версией этой программы для части о родившихся. Меня давно спрашивали, как помочь моей индексации по селу Русская Буйловка - вот так и можно помочь. Года, которые находятся в обработке, можно будет отследить в ТГ канале сообщества по хештегу #Инструменты@builovo, чтобы не делать одно и то же. Программа в виде приложения для Windows. Я не пробовала запускать ее еще где-то, поэтому в каком-то смысле это будет ее тестирование. Хоть она и написана целиком нейросетью, постараюсь оказать поддержку при выявлении ошибок и проблем. Мне самой ее в таком виде точно достаточно.

Почему через программу быстрее?
Раньше я просто вводила данные не глядя "в одну строчку", сейчас можно делать также, используя клавишу TAB - она переключает поля.

Как пользоваться?

1. Скачиваете архив и распаковываете на своем компьютере. Получится одна папка "mk_indexer_1", внутри которой будет лежать папка _internal с внутренними файлами, которая нужна программе для работы, и само приложение "mk_indexer_1.exe". Установка не требуется. Запускается двойным кликом мышки по mk_indexer_1.exe. Можно создать ярлык и вынести на рабочий стол для удобства.

-2

2. При первом запуске окно выглядит так:

-3

3. Указать настройки индексации.

При первом запуске программа еще ничего не знает, нужно задать часто повторяющиеся поля, чтобы не писать их каждый раз. Для этого есть вкладка "Настройки". Все прописанные настройки можно менять в процессе работы, главное, нажать "Сохранить настройки". Они применяются сразу, даже если изменения не отображаются на Вводе данных. Это небольшая ошибка, обновится после перезапуска программы.

-4

4. Заполнение персоны выглядит так:

-5
-6

В программе предусмотрены еще две вкладки для просмотра, редактирования и отображения данных по фильтрам. В целом, все эти действия можно делать в таблице и напрямую. Просто нейросеть предложила добавить, а я не стала отказываться.

5. В результате мы получаем таблицу с данными.

-7

И файлы:

-8

Появился файл с настройками settings_part1.json и сама таблица. При следующем запуске программы настройки уже применены.

Со временем я постараюсь выложить программы для частей о бракосочетавшихся и об умерших, для Ревизских сказок, а также попробую оформить свои генераторы и парсеры в гостеприимный вид. Пока что попробую сама поработать через такой индексатор.

Где скачать последнюю версию?

С моего гугл-облака по ссылке или в ТГ канале сообщества.