Реформа орфографии 1918 года так изменила русский язык, что простое чтение дореволюционных книг и газет недоступно обычным гражданам. Сотрудники новосибирского Института вычислительных технологий (ИВТ) разработали систему, которая почти автоматически позволяет переводить дореволюционные издания в современную русскую орфографию, сообщает издание Сибирского отделения РАН "Наука в Сибири". «Просто заменить устаревшие буквы на современные и убрать твердые знаки в конце слов недостаточно, есть случаи гораздо сложнее», - объясняют ученые. За основу разработчики взяли «Справочник по старой орфографии русского языка». Он во многом помог им составить правильный алгоритм перевода слов из старого написания в новое. Алгоритм создан с целью заменить не эксперта, а скорее корректора, для работы с большими объемами текстов. Для ученых-филологов это — новый инструмент для работы с текстами. Пока программа еще не способна правильно анализировать случаи, которых нет в справочниках. В дальнейшем ученые
В Сибири создали алгоритм для перевода дореволюционных изданий
26 марта 202026 мар 2020
13
~1 мин