Реформа орфографии 1918 года так изменила русский язык, что простое чтение дореволюционных книг и газет недоступно обычным гражданам.
Сотрудники новосибирского Института вычислительных технологий (ИВТ) разработали систему, которая почти автоматически позволяет переводить дореволюционные издания в современную русскую орфографию, сообщает издание Сибирского отделения РАН "Наука в Сибири".
«Просто заменить устаревшие буквы на современные и убрать твердые знаки в конце слов недостаточно, есть случаи гораздо сложнее», - объясняют ученые. За основу разработчики взяли «Справочник по старой орфографии русского языка». Он во многом помог им составить правильный алгоритм перевода слов из старого написания в новое.
Алгоритм создан с целью заменить не эксперта, а скорее корректора, для работы с большими объемами текстов. Для ученых-филологов это — новый инструмент для работы с текстами. Пока программа еще не способна правильно анализировать случаи, которых нет в справочниках. В дальнейшем ученые хотят доработать ее так, чтобы были выявлены и решены все случаи.
Если проект будет востребован массовыми пользователями, то доработка программы, по словам ученых - задача ближайшего будущего.