Марийский язык занял четвёртое место среди языков сервиса «Яндекс.Переводчик» — это показал анализ запросов пользователей. Такой факт привели участники VII Международной научно-практической конференции «Цифровизация языков народов России: масштабирование опыта и перспективы», которая собрала в Йошкар-Оле лингвистов, IT-специалистов, педагогов и языковых активистов из десятков регионов.
До пленарных дискуссий гости и участники на площадке Марийского государственного университета знакомились с выставочными проектами. Разработчик Андрей Чемышев представил возможности интернет-энциклопедии «РУВИКИ». По его словам, платформа уделяет отдельное внимание статьям о культуре и традициях марийского народа. Наличие выверенной информации помогает искусственному интеллекту отвечать корректно: например, голосовой помощник «Алиса» при запросах о регионе будет опираться на достоверные российские источники.
Студентка Юлия Ефремова показала свою дипломную работу — нейросетевые инструменты для уроков истории и культуры народов. С помощью текстовых запросов к ИИ она создала иллюстрации и карточки с заданиями для школьников. Девушка призналась: сложнее всего подобрать промпты, которые нейросеть трактует без искажений. Национальная специфика для алгоритмов пока остаётся слабым местом.
Открывая конференцию, директор Института национальной культуры и межкультурной коммуникации МарГУ Родион Чузаев назвал язык не просто средством общения, а цифровым кодом культуры. По его мнению, перед исследователями стоит монументальная задача — перенести это наследие в будущее.
Заместитель министра культуры, печати и по делам национальностей Республики Марий Эл Николай Любимов зачитал обращение заместителя председателя правительства региона — министра Константина Иванова. В нём говорилось, что цифровизация языков — одна из скреп, объединяющих страну как многонациональную семью, и конференция призвана выработать решения от электронных корпусов до инструментов на основе ИИ, чтобы масштабировать лучшие практики по всей России.
Участники из Китая, Казахстана, Сербии, Кыргызстана и Узбекистана подключились онлайн, рассказывая о лингвистических проектах в своих странах. Офлайн выступали учителя, методисты и активисты из российских регионов.
Важную новость сообщила председатель Ассамблеи народов России Республики Марий Эл Лариса Яковлева. Национально-культурная автономия марийцев России в пятый раз участвовала в конкурсе Федерального агентства по делам национальностей и выиграла субсидию — 5,1 миллиона рублей. Средства направят на популяризацию и цифровизацию марийского языка.
Партнёрство МарГУ с компанией «Яндекс», оформленное договором в 2024 году, продолжается, и часть гранта пойдёт на совместные проекты. Андрей Чемышев пояснил: из всех источников, содержащих информацию о национальных костюмах, узорах, вышивке, антропологических особенностях, с помощью специальной программы аннотируют иллюстрации с указанием автора и места съёмки. Затем на этих данных «Яндекс» будет обучать нейросети. Цель — добиться правильного распознавания особенностей марийского народа. В перспективе — оцифровка музыки марийских композиторов, создание полноценного видео, улучшение синтеза и распознавания речи, оптическое распознавание символов для марийских текстов. Нейросеть уже научили говорить на марийском.
Проректор по стратегическому развитию МарГУ Вера Токтарова подтвердила: марийский язык — четвёртый по популярности в «Яндекс.Переводчике». Люди хотят пользоваться родным языком в интернете, а задача учёных — обеспечить эту возможность через распознавание речи, электронные словари, системы проверки орфографии, синтезаторы речи и голосовых помощников. Однако одного голоса мало, нужны верные визуальные образы. Токтарова привела пример: по запросу «свадебные наряды в районах Марий Эл» нейросеть выдаёт хаотичную смесь традиций. Современные модели обучаются на западноцентричных наборах данных, где культура малых народов представлена фрагментарно или искажённо. «Это уже вопрос цифрового суверенитета малых этносов», — сказала она. Совместно с «Яндексом» университет начал создавать уникальную базу изображений национальных костюмов и предметов быта марийского народа. Искусственный интеллект способен корректно работать с национальными особенностями только при условии экспертного сопровождения, точной локации и верификации результатов исследователями. Без этого он скатывается в стереотипы.
Советник отдела планирования и реализации государственной национальной политики Управления государственной политики в сфере межнациональных отношений ФАДН России Александр Рашковский подвёл итоги мониторинга состояния языков народов РФ в IT-сфере. В прошлом году ведомство провело исследование в 41 субъекте, охватив 70 языков. Электронными словарями обеспечены 68 языков — на 15 процентов больше, чем годом ранее. Зафиксирован значительный рост образовательных цифровых программ. По словам Рашковского, МарГУ стал первой научной организацией в России, которая системно занимается исправлением этнических стереотипов у генеративного искусственного интеллекта. Он выразил уверенность, что к этому проекту в будущем подключатся коллеги из других регионов.