Сбер обучает нейросеть «ГигаЧат» татарскому языку при поддержке Академии наук Татарстана. Проект формирует цифровой корпус из литературы и прессы для сохранения культурного наследия народов России. Первый заместитель председателя правления Сбербанка Александр Ведяхин объявил о старте проекта во время своего визита в Казань. Сбербанк и Академия наук Республики Татарстан заключили соглашение о расширения языкового разнообразия нейросети «ГигаЧат». Научные сотрудники Академии предоставят компании лингвистическую экспертизу и архивные материалы. Также они проверят качество обучающих материалов и помогут нейросети освоить особенности татарской грамматики. Это позволит ей корректно генерировать тексты на татарском языке, а не просто переводить их с русского. Для обучения «ГигаЧата» был сформирован масштабный корпус текстов на татарском языке. В него вошли произведения классической литературы, современная пресса, учебники и научные публикации. Такой подход обеспечил нейросети понимание языка
Нейросеть с акцентом: «ГигаЧат» обучают языкам народов России
17 февраля17 фев
1
3 мин