В сети работает онлайн-переводчик Bashkortsoft. Башкирские филологи и программисты доработали его в 2022–2023 годах на грант Главы Башкирии на сохранение и развитие государственных языков, сумма поддержки составила 3 млн рублей. Bashkortsoft.ru — высококачественный речевой машинный переводчик. Он распознаёт и текст, и голос, переводит цельные предложения и более крупные куски текстов.
К истории вопроса. Благодаря грантовой поддержке в 2020–2021 годах удалось совершить качественный скачок в вопросе создания систем искусственного интеллекта для башкирского языка: в короткий срок были выполнены работы по сбору необходимых данных (как переводов текстов, так и записей речевых фрагментов), по разработке алгоритмов машинного обучения и по расчетам нейросетевых моделей на серверах.
Для реализации проекта были накоплены параллельные обучающие корпуса данных, проведена разработка методов искусственного расширения обучающих данных, внедрение структурно-функциональной модели морфем, а также создание программных средств обучения машинного переводчика на основе современных нейросетевых подходов.
Благодаря применению современных программных средств были обработаны текстовые архивы общим объемом более 2 млн пар русско-башкирских предложений, а также создана первая для башкирского языка профессиональная аннотированная речевая база мужского голоса. В результате работ любому пользователю интернета стали доступны системы машинного перевода и синтеза башкирской речи, технологически соответствующие уровню аналогов для крупнейших мировых языков.
Разработка системы распознавания башкирской речи не только сделает онлайн-переводчик более технологичным и комфортным для использования, но также будет способствовать дальнейшему росту количества пользователей. Так, возможности переводчика облегчат работу и жизнь людей с ограничениями по зрению, а также людям, которые по тем или иным причинам не имеют возможности набирать текст на башкирском языке, например, с неустановленной башкирской локализацией на компьютере или специализированной клавиатурой на мобильном устройстве.
«Реализация данного проекта сделала башкирский вторым тюркским языком в мире (после турецкого), для которого станет доступен подобный функционал речевого перевода», — отметили в Фонде по сохранению и развитию башкирского языка.
Заключительным этапом проекта стала доработка программной части сайта, чтобы стало возможно расшифровывать записи.
Впервые для башкирского языка были созданы самые современные нейросетевые алгоритмы, «выставляющие» знаки препинания и заглавные буквы при переводе устной речи в письменную, что сделает получаемый текст более качественным и «читаемым».
Башкирский стал одним из первых языков в РФ, для которого появился качественный машинный перевод с поддержкой речевого интерфейса, что безусловно повысит статус башкирского языка в интернете, полагают создатели.
Глава Башкирии уделяет большое значение вопросам сохранения и развития башкирского и других языков народов, проживающих на территории республики.
«Мы должны стать успешными, чтобы самим быть ответственными хозяевами на своей земле. Сохранить и укрепить Башкортостан для наших детей, последующих поколений. Воспитать в них бережное отношение к тому, что передали нам с вами наши предки», — говорил он на V Всемирном курултае башкир.