Добавить в корзинуПозвонить
Найти в Дзене
IT Russia brief

В России бурятский язык стал цифровым

В России оцифровали и интегрировали в цифровые сервисы бурятский язык Бурятский язык начали системно интегрировать в цифровые сервисы и образовательные платформы. Он теперь доступен в «Яндекс Переводчике»; кроме того, запущены проекты машинного перевода, распознавания речи и перевода школьных учебников. 24 октября 2025 года, в День бурятского языка, он стал доступен в «Яндекс Переводчике». Пользователи получили возможность переводить тексты с бурятского языка более чем на 100 языков мира и обратно. Сейчас сервис работает в качестве бета-версии. Используется литературный вариант бурятского языка, принятый в республике в качестве официального. Для запуска перевода в апреле 2025 года в «Яндекс» передали параллельный корпус бурятского языка объёмом 120 тысяч предложений, который подготовили специалисты ГБУ РЦ «Бэлиг». Позже компания получила монокорпус объёмом более 2 млн предложений. Все эти данные использовали для обучения модели машинного перевода. В декабре 2025 года был подписан догов
Оглавление
   Источник изображения: ItRussia.Media
Источник изображения: ItRussia.Media

В России оцифровали и интегрировали в цифровые сервисы бурятский язык

Бурятский язык начали системно интегрировать в цифровые сервисы и образовательные платформы. Он теперь доступен в «Яндекс Переводчике»; кроме того, запущены проекты машинного перевода, распознавания речи и перевода школьных учебников.

Переводчик с бурятского

24 октября 2025 года, в День бурятского языка, он стал доступен в «Яндекс Переводчике». Пользователи получили возможность переводить тексты с бурятского языка более чем на 100 языков мира и обратно. Сейчас сервис работает в качестве бета-версии. Используется литературный вариант бурятского языка, принятый в республике в качестве официального.

Для запуска перевода в апреле 2025 года в «Яндекс» передали параллельный корпус бурятского языка объёмом 120 тысяч предложений, который подготовили специалисты ГБУ РЦ «Бэлиг». Позже компания получила монокорпус объёмом более 2 млн предложений. Все эти данные использовали для обучения модели машинного перевода.

Голосовые технологии и искусственный интеллект

В декабре 2025 года был подписан договор о передаче «Яндексу» базы голосовых записей на бурятском языке. Сейчас ведётся сбор и разметка аудиоданных для обучения моделей распознавания и синтеза речи.

Эти данные планируют использовать в системах голосового управления, мобильных приложениях, виртуальных ассистентах и образовательных платформах. Материалы проходят проверку и верификацию перед использованием в алгоритмах машинного обучения.

Учебники на бурятском языке

В Бурятии также продолжается перевод школьных учебников на бурятский язык. В 2024 году было принято решение о введении преподавания отдельных предметов на бурятском языке в 1–4 классах школ, где он изучается как родной.

Проекты «оцифровки» бурятского языка создают основу для его дальнейшего использования в ИТ, образовании и сервисах на базе искусственного интеллекта.