Аспирантка Новосибирского государственного университета Анна Мурашкина разработала инновационную систему на базе машинного обучения для автоматического распознавания и оцифровки древних тибетских манускриптов. Проект направлен на сохранение более 70 000 рукописей XVIII–XX веков из архивов Сибирского отделения Российской академии наук, находящихся под угрозой утраты. Приложение, созданное Мурашкиной, использует нейронную сеть, обученную на текстах из фонда Института монголоведения и буддологии Сибирского отделения РАН. Это позволило создать систему, адаптированную к специфике тибетского письма и лингвистическим особенностям текстов. Мурашкина провела лингвистическую разметку, что обеспечило точное соответствие распознанных символов их реальным значениям. Она также разработала систему оценки качества распознавания, что позволяет минимизировать ошибки и повысить точность обработки текстов. Разработанная система демонстрирует более высокую точность распознавания символов тибетского брахми
Российская студентка изобрела новую программу для сохранения тибетских текстов
17 июля 202517 июл 2025
19
1 мин