Российская интернет-энциклопедия РУВИКИ передала материалы для обучения нейросети «ГигаЧат», разработанной Сбербанком, 20 языкам народов России. Переданные материалы включают тексты на алтайском, башкирском, бурятском, вепсском, горномарийском, ингушском, коми, коми-пермяцком, марийском, мокшанском, ливви-карельском (одном из трех основных наречий карльского, ливвикском – прим. Т-и), татарском, тувинском, калмыцком, удмуртском, хакасском, чеченском, чувашском, эрзянском и якутском языках. На основе собранных волонтерами энциклопедических статей большая языковая модель будет осваивать идиомы народов России. Это позволит не только повысить качество генерации текстов на них, но и сохранить уникальное культурное наследие в цифровую эпоху, рассчитывают организаторы проекта. «Наша миссия – делать знания доступными для всех, в том числе на языках народов России. Мы видим, как технологии становятся важным инструментом сохранения культурной идентичности и знаний, находившихся под угрозой утраты
РУВИКИ поможет обучить «ГигаЧат» 20 языкам народов России
31 октября 202531 окт 2025
1 мин