Учёные Мурманского арктического университета разработали цифровой инструмент для анализа изменений словарного состава русского языка. Программа использует метод «цифрового сита», позволяющий автоматически просчитывать частоту употребления слов и фиксировать появление новых терминов. Анализ проводился на материале Национального корпуса русского языка (более 250 миллионов слов) за три периода: досоветский, советский и постсоветский. Алгоритм учитывал начальные формы слов для точного сопоставления частоты их использования. Выяснилось, что приток новых слов сокращается, но активный словарный запас растёт. Исчезают термины типа «псевдогаллюцинация», появляются «транслит», «лизинговый» и «внедорожник». Также фиксируется рост числа цифр в современных текстах. Данные помогут прогнозировать развитие русского языка и создавать модели для искусственного интеллекта, которые смогут понимать и предсказывать динамику лексики и тенденции изменений. Больше новостей и эксклюзивных видео смотрите в канал
Мурманские ученые создали программу для изучения изменений русского языка
17 февраля17 фев
1
1 мин