Студенты в штате Техас будут первыми, кто пройдет обновленные тесты, утвержденные государством, с использованием платформы на основе искусственного интеллекта. Письменная часть экзамена по оценке академической готовности штата Техас (STAAR), которая проверяет уровни навыков в чтении, письме, естественных науках и обществознании, будет оцениваться с помощью "автоматизированного механизма подсчета баллов".
Экзамен был переработан в 2023 году. Обновленный тест теперь содержит меньше вопросов с выбором ответа и больше открытых вопросов, называемых комплексными ответами. Новые тесты включают в себя вдвое больше открытых вопросов, чем раньше. По данным Texas Tribune, использование обработки естественного языка может сэкономить штату более $20 миллионов ежегодно - средства, которые ранее были бы направлены на найм оценщиков результатов у сторонних поставщиков.
Хосе Риос, директор по оценке студентов в Texas Education Agency (TEA), заявил, что они стремились сохранить как можно больше открытых ответов, но отметил, что требуется значительное количество времени для оценки результатов. Машины не полностью заменят оценщиков - по крайней мере, на данный момент. В прошлом году TEA наняло примерно 6000 временных оценщиков, в то время как в этом году им потребуется менее 2000 человек.
Одна четверть всех автоматически оцененных ответов и тестов, в которых компьютер неуверен в своих оценках, будут повторно проверены людьми. Ответы, написанные на других языках или с использованием специализированной терминологии, также будут отданы на оценку людям. Система автоматической оценки была обучена на базе 3000 ответов, которые изначально были оценены людьми. Эти образцы помогли искусственному интеллекту оценить характеристики ответов и научиться выставлять похожие оценки как человек.