В последнее время ученики и родители все чаще ругаются на качество учебников, а в сети то и дело появляются публикации с нелепыми задачками и упражнениями по русскому языку. В ответ Министерство образования и научные издательства в один голос говорят, что подбирать авторов учебников – очень сложная задача.
Человеческий фактор никто не отменял, ошибки неизбежны. А что, если доверить написание учебников не людям, а искусственному интеллекту? Этим вопросом задались российский математики и лингвисты и решили разработать алгоритм, который научится определять уровень сложности и удобочитаемости текста.
Ученые уже научились собирать сложные нейросети, которые мыслят креативно. ИИ с легкостью обыгрывает людей даже в те игры, где невозможно просчитать ходы, обрабатывает фото в заданном стиле, создает картины и пишет музыку. Настала пора поработать во благо образования!
Как работает алгоритм
До сих пор для оценки удобочитаемости текста использовались два индекса: FRE и FKG, изначально разработанные для английского, а позже адаптированные для русского языка. Но они позволяют оценить сложность текста лишь по длине предложений и слов, а глубокий анализ требует проверки намного большего числа параметров.
В новой системе машинного обучения казанские ученые совместно с коллегами из Мексики впервые реализовали математически обоснованный способ оценки сложности русскоязычного текста. Им удалось «заставить» ИИ учитывать не только число слов в предложениях и слогов в словах, но и вхождение разных частей речи, их пропорциональное соотношение, падежные склонения и прочие факторы, влияющие на удобочитаемость.
По мнению создателей, система способна анализировать текст не хуже человека, а, значит, ей можно доверить разработку учебников для школ и вузов. Нейросеть сможет точно определить возрастную группу обучающихся и создать тексты, которые будут доступны, понятны и интересны читателям определенного возраста.
Перспективы использования
Система машинного обучения тестировалась на учебниках по социологии и обществознанию. Они практически не содержат нетекстовой информации и часто используются школьниками при подготовке к ЕГЭ. Анализ производился по 11 параметрам, влияющим на сложность восприятия текста. В результате был определен оптимальный способ подачи информации.
Профессор Казанского университета Валерий Соловьев отметил, что разработанная система поможет повысить уровень обучения в стране и будет способствовать продвижению России в международном рейтинге образования. На развитие проекта был выделен грант Российского научного фонда.