Добавить в корзинуПозвонить
Найти в Дзене

Ученые РАН создали нейросеть, которая распознает карельский язык

В перспективе технология позволит переводить устную речь на карельском в онлайн-режиме. Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) в сотрудничестве с коллегами из Карельского научного центра РАН создали программный комплекс, который распознает карельскую речь. Об этом сообщает Министерство образования Российской Федерации. Разработка ученых направлена на сохранение карельского языка. По оценкам специалистов, в настоящее время на нем говорят около 30 тысяч человек, из которых 25 тысяч проживают в России. В повседневной жизни карельский язык используют лишь 5-7 тысяч, что ставит его под угрозу исчезновения. «Мы создали систему автоматического распознавания речи для ливвиковского наречия карельского языка, распространенного на юге и юго-западе Карелии. Изучение карельского языка имеет огромное значение не только для сохранения культурного наследия, но и для поддержки языковой традиции его носителей. Создание системы распознавания карельской р
   Фото создано нейросетью Kandinsky
Фото создано нейросетью Kandinsky

В перспективе технология позволит переводить устную речь на карельском в онлайн-режиме.

Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) в сотрудничестве с коллегами из Карельского научного центра РАН создали программный комплекс, который распознает карельскую речь. Об этом сообщает Министерство образования Российской Федерации.

Разработка ученых направлена на сохранение карельского языка. По оценкам специалистов, в настоящее время на нем говорят около 30 тысяч человек, из которых 25 тысяч проживают в России. В повседневной жизни карельский язык используют лишь 5-7 тысяч, что ставит его под угрозу исчезновения.

«Мы создали систему автоматического распознавания речи для ливвиковского наречия карельского языка, распространенного на юге и юго-западе Карелии. Изучение карельского языка имеет огромное значение не только для сохранения культурного наследия, но и для поддержки языковой традиции его носителей. Создание системы распознавания карельской речи — один из способов если не возродить, то хотя бы задокументировать этот язык», — рассказала одна из авторов разработки, старший научный сотрудник лаборатории речевых и многомодальных интерфейсов СПб ФИЦ РАН Ирина Кипяткова.

В будущем на основе этой программы можно будет создать онлайн-переводчик с карельского языка. В мире есть только одна программная модель, которая его распознает. В дальнейшем ученые планируют научить нейросеть распознавать смешение карельского и русского, так как многие носители в разговорной речи переключаются с одного языка на другой.

Ученые отмечают, что карельский язык является малоресурсным. На нем существует крайне мало электронных данных. Это осложнило обучение нейросети. Искусственный интеллект обучался на материалах карельских периодических изданий, текстов на ливвиковском наречии из корпуса вепсского и карельского языков ВепКар. Данные разговорной речи ученые взяли из радиопередачи «Родной берег» ГТРК «Карелия», а также специально собрали записи карельской речи.

Ранее сообщалось, что карельский и вепсский языки появятся в «Яндекс Переводчике». Уроки карельского языка есть в проекте «Республики».