Найти тему
За Калужской заставой

Вице-мэр Ракова: Более 20 млн раз пользователи обратились к порталу по генеалогии «Поиск по архивам» за год

   mos.ru
mos.ru

Свыше 20 млн раз воспользовались москвичи порталом «Поиск по архивам», сообщила заммэра по вопросам социального развития Анастасия Ракова.
Она напомнила, что в запущенный год назад портал загрузили более 5,4 млн страниц исторических материалов из Главархива Москвы и другие материалы.

Сервис упрощает пользователям процесс поиска историй своих семей, помогает ученым и журналистам, а на страницах, содержащих устаревшие символы и рукописи, тренируется искусственный интеллект.

Поиск по архивам — запущенный в начале 2023 года сервис Яндекса, который помогает быстро находить упоминания людей, населенных пунктов и событий в расшифрованных нейросетью рукописных документах XVIII-XX веков.

«На протяжении нескольких последних лет запросы, связанные с поиском предков и исследованием прошлого семьи, оказываются одними из самых популярных в Главархиве Москвы», – отметила Ракова.

Несколько лет назад появился онлайн-сервис «Моя семья», на котором разместили оцифрованные метрические книги. На основе ресурса «Моя семья» нейросеть «Поиска по архивам» училась читать рукописные тексты.

За год к сервису обратились более 20 млн раз, а нейросеть проанализировала свыше 10 млн страниц исторических документов.

Сервис «Поиск по архивам» помогает историкам, социологам, демографам, журналистам и простым москвичам находить информацию об исторических событиях и личностях. Как отметили в Соцкомплексе столицы, работать с архивными документами теперь так же легко, как с привычным поиском Яндекса.

Сейчас в «Поиске по архивам» доступны документы из архивов 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и других областей. Всего нейросеть Яндекса распознала более 60 тысяч рукописных и печатных текстов середины XVIII — начала XX веков: в сумме это более 10 миллионов страниц, или 492 миллионов строк. В «Поиске по архивам» хранятся расшифрованные архивные дела, в которых содержится информация о людях, родившихся в России до 1917 года. Сервис собрал 3,6 млн оцифрованных страниц периодических изданий.

Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки, учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с версткой газетных страниц нейросеть научили распознавать текст на огромных полосах, набранный мелким шрифтом на низкоплотной бумаге.