Студентка Гуманитарного института Новосибирского государственного университета Анна Мурашкина разработала систему автоматического распознавания и транслитерации классических тибетских текстов, выполненных с использованием тибетского слогового письма, восходящего к древнеиндийской письменности брахми. В своем исследовании Анна использовала изображения страниц рукописей и ксилографов, а также применяла методы машинного обучения для построения модели, которая способна точно распознавать символы тибетского алфавита с изображений и переводить их в машиночитаемый формат. Для повышения точности она вручную разметила корпус данных и провела дообучение сверточной нейросети, создав модульный алгоритм OCR, включающий этапы предобработки, сегментации, распознавания и постобработки. По словам Анны Мурашкиной, актуальность проекта обусловлена необходимостью сохранения культурного наследия Тибета, представленного многочисленными рукописями и ксилографами, которые под угрозой разрушения. Оцифровка эти
Студентка новосибирского вуза разработала приложение для распознавания тибетских текстов
17 июля 202517 июл 2025
1 мин