Найти тему

Яндекс "Поиск по архивам" - пригодился?

Оглавление

Яндекс сделал отдельный проект «Поиск по Архивам».

Я задалась вопросом - Насколько он полезен при составлении родословной?

Фото с сайта Яндекс Поис по Архивам.
Фото с сайта Яндекс Поис по Архивам.

Почитала коменты в телеграмм, людям все нравится, все ждут пополнения фондов базы...

Решила посмотреть, так ли это хорошо? Конечно, это зависит от каждой конкретной ситуации, и вместе с тем…

Мне показалось - отличная идея!

Яндекс на своем ресурсе заявляет:

"Нейросети Яндекса распознают архивные документы от середины XVIII до начала ХХ века.
Можно не просматривать рукописные записи, а просто искать — как в интернете".

Представила, что я только начинаю строить родословное древо, попробовала поискать.

Сразу увидела плюсы:

  • сбылась мечта всех, кто только приступает к поиску – можно искать по фамилии сквозным поиском, забиваешь фамилию – выдает список документов (как в обычном поисковике);
  • не надо разбираться в бесконечно сложной системе поиска в архивах, а это правда - не простая задача;
  • внедрен переводчик, программа, которая адаптирует старую (и очень старую) литерацию к современному прочтению;
  • качественная цифра размещенных документов – а это не мало!
  • данный ресурс отлично продвигает идею составления родословной своей семьи, что автоматически повышает интерес людей к изучению истории, как науки.

Дальше увидела минусы:

  • документов очень мало, пока география скромная;
  • по поисковому запросу выдается лишь одна страница книги, где выделен фрагмент, соответствующий запросу, посмотреть всю книгу – у меня не получилось.
  • качество программы, отвечающей за перевод текста, еще не очень хорошее. Я, увеличив фрагмент текста, прочитать смогла, программа - нет;
  • перспектива размещения в данном сервисе всех архивов страны – туманная, по моему скромному мнению.

Почему туманная…

Уже сегодня есть оцифрованные книги в различных архивах, например Калужская область, Вологодская область и т.д.

Да - не все архивы так активны с оцифровкой.

Да - даже в продвинутых архивах не все документы оцифрованы.

Но! Они не горят желанием давать Яндексу доступ в уже оцифрованные базы.

Связано это, на мой взгляд, с несколькими причинами:

  1. Яндекс дает открытый доступ (без регистрации), в то время, как при доступе в архивы онлайн, каждый архив требует внесения личных данных.
  2. Яндекс дает доступ бесплатно, а некоторые архивы делают это за отдельную плату (небольшую, к слову сказать).
  3. Чтобы сделать качественную оцифровку книг так, чтобы переводчик текста работал приемлемо, требуется все книги расшивать, а это впрямую влияет на их сохранность.
  4. Архивы не видят научной пользы, которая бы облегчила их работу.

Выводы, которые у меня получились:

Если бы я начинала с поиска в Яндекс – вероятность составления достоверных родословных фамильных схем была бы очень низкой.

Прежде всего, потому, что привязка должна быть не только к поиску по фамилии, и населенному пункту, но и к поиску по документам прихода конкретной церкви. Я об этом писала в статье «С чего начать?».

Также, некоторые Метрические книги и Исповедные ведомости сшиты по большому временному отрезку от 2 до 10 лет, и требуют «ручного» анализа, что позволяет расширять родословное древо, добавляя новые родственные связи.

На мой взгляд, лучше всего сформулировало эту мысль (как не странно) Федеральное Архивное Агентство, которое заключило в 2023 году договор на распознавание описей архива, это головная боль РГАДА, мало оцифрованных дел, есть оцифрованные описи, но они очень старые, часть из них машинописный текст, искать по ним крайне тяжело, чем все закончилось - ниже (полный текст здесь):

«Итоги этого распознавания были продемонстрированы на встрече в середине 2023 г. с участием представителей Федерального архивного агентства (Росархива), РГАДА и Яндекса. Основные выводы по результатам проделанной работы сводились к следующему: Качество распознавания описей не позволяет использовать данный продукт без обращения к оригиналу описи, поэтому его нельзя признать удовлетворительным (при анализе методом шинглов доля распознавания составила 44,8% для машинопечатных описей и 25,6% для всех типов рукописных описей)».

То есть, опираться только на данные распознавания не получается, все равно необходим оригинал.

А ведь сервис Яндекс опирается именно на распознавание текста, а для рукописных текстов доля только 25,6% - это как раз то, что мы видим, как результат поиска…

Кроме того, в пределах одного населенного пункта фамилии наших предков могли меняться несколько раз… Подробно об этом - в статье «Как найти родоначальника фамилии, потратив 300 руб? Практикум".

Нейросети - это круто, это будущее - несомненно, но на мой взгляд – сквозной поиск по архивам онлайн остается по-прежнему пока лишь мечтой.

На сегодня - это все.

Была рада вновь повидаться с Вами.

Если вам моя статья показалась полезной и облегчила жизнь - это здорово!

Искренне Ваша...

Подписывайтесь на каналы:

Дзен: Родословная - это легко

Телеграмм: Родословная - это легко