55 подписчиков
🤓Кибернетики НИЯУ МИФИ и Института русского языка им. Виноградова РАН разрабатывают поисковик для изучения древних рукописей XI-XVIII веков – лингвистическую интеллектуальную систему ЛИС
Проект поддержан в рамках Научного направления программы «Приоритет 2030».
🖥ЛИС «Рукописное наследие Древней Руси» будет способна распознавать церковно-славянские рукописи XI-XVIII веков и представлять их выборку под конкретный запрос.
📜Для формирования корпуса изучаемых объектов специалисты выбрали богослужебные книги – Минеи. Таких книг в библиотеках, архивах и хранилищах музеев сохранилось больше всего, причем, в хорошем состоянии. Сейчас в цифровом виде примерно 250 книг (по 500 страниц каждая), хранящихся в РГБ, Историческом музее, областных библиотеках.
Александра Плетнева (МИФИ и ИРЯ РАН):
📜 «Когда будут решены задачи распознавания и поиска, мы сможем в наших рукописях искать любые вещи, примерно так, как это делается сейчас в Яндексе. Допустим, можно будет сделать запрос в ЛИС по конкретному слову, словосочетанию, фрагменту вязи, буквице – как они менялись на протяжении 700 лет? В настоящее время у нас нет общедоступной системы распознавания славянских рукописей. Есть немецкая система Transkribus, но она, во-первых, платная, а во-вторых, требует специальной и довольно сложной настройки для каждого нового почерка, мы же создаем самообучающуюся систему, способную распознавать рукописи разных эпох и разных почерков. И самое главное – Transkribus распознает отдельные рукописи, но не объединяет результаты распознавания в корпус. Наш же проект позволит увидеть развитие языка «в движении», увидеть все варианты использования интересующих вас буквы или слова – во всех рукописях, внесенных в базу данных. У каждого исследователя будет в системе свой отдельный кабинет, где он сможет решать те задачи, которые интересны именно ему. И что очень важно – это будет открытый проект, доступный всем. А дальше можно будет применить наработанные алгоритмы и для рукописей на других древних языках, причем не только славянских – зарубежные исследователи уже проявляют большой интерес к этому проекту». Полный текст и фотографии — в комментариях.
1 минута
29 мая 2024