Найти в Дзене
РИЦ «Югра»

Югра празднует Международный день коренных народов мира созданием лингвистических корпусов

В Югре идёт работа по созданию корпусов хантыйского и мансийского языков. Об этом сообщил 9 августа, в Международный день коренных народов, губернатор ХМАО Руслан Кухарук. «В преддверии праздника провел рабочее совещание по вопросам создания корпусов мансийского и хантыйского языков – обширной базы данных текстов, которая используется для их изучения, анализа структуры, лексики и грамматики», – поделился губернатор. Корпус мансийского языка содержит параллельный перевод предложений с русского на мансийский язык, аудиозапись речи, оцифровку произведений мансийских авторов и периодических изданий на мансийском языке. Готов и мансийский языковой портал. Его сервис позволит использовать автоматический перевод и словарь. Сам корпус содержит 146 тысяч пар, которые интегрируют в «Яндекс.Перевод». Презентация пройдёт в конце года к юбилею Ханты-Мансийского автономного округа. «Параллельно ведется работа над созданием корпуса хантыйского языка – уже сформировано более 10 тысяч пар параллельных
   Югра празднует Международный день коренных народов мира созданием лингвистических корпусов
Югра празднует Международный день коренных народов мира созданием лингвистических корпусов

В Югре идёт работа по созданию корпусов хантыйского и мансийского языков. Об этом сообщил 9 августа, в Международный день коренных народов, губернатор ХМАО Руслан Кухарук.

«В преддверии праздника провел рабочее совещание по вопросам создания корпусов мансийского и хантыйского языков – обширной базы данных текстов, которая используется для их изучения, анализа структуры, лексики и грамматики», – поделился губернатор.

Корпус мансийского языка содержит параллельный перевод предложений с русского на мансийский язык, аудиозапись речи, оцифровку произведений мансийских авторов и периодических изданий на мансийском языке. Готов и мансийский языковой портал. Его сервис позволит использовать автоматический перевод и словарь. Сам корпус содержит 146 тысяч пар, которые интегрируют в «Яндекс.Перевод». Презентация пройдёт в конце года к юбилею Ханты-Мансийского автономного округа.

«Параллельно ведется работа над созданием корпуса хантыйского языка – уже сформировано более 10 тысяч пар параллельных предложений на русском и хантыйском языках. Мы продолжим эту работу, чтобы сохранить и приумножить культурное наследие Югры, России», – подытожил Руслан Кухарук.

Что в Югре закончили цифровую обработку мансийского языка, губернатор Ханты-Мансийского автономного округа Руслан Кухарук сообщил в июне на международном IT-форуме в Ханты-Мансийске.

Читать в источнике