Найти в Дзене
DigEd

Почему университеты должны радикально переосмыслить экзамены в эпоху искусственного интеллекта

Оглавление
Иллюстрация Мэтта Чинворта
Иллюстрация Мэтта Чинворта

Авторы Витомир Кованович, Абхинава Бартакур, Сречко Йоксимович и Джордж Сименс

Академическое сообщество не готово к росту популярности чат-ботов среди студентов, но с помощью правильных инструментов искусственного интеллекта персонализированное обучение может вскоре стать реальностью.

С момента запуска чат-бота ChatGPT в конце 2022 года педагоги пытаются понять, как использовать искусственный интеллект для улучшения обучения при минимальном риске для образовательных результатов и справедливости оценок.

Использование ИИ среди студентов сейчас является нормой. В феврале опрос более 1000 студентов дневного отделения британских вузов показал, что 92% из них в той или иной форме используют ИИ, по сравнению с 66% в 2024 году. А 88 % студентов сообщили, что полагаются на генеративный ИИ (форма ИИ, которая может создавать текст, изображения и код из обширных наборов данных) для поддержки своих академических курсовых работ, по сравнению с 53 % в 2024 году.

Поскольку ИИ продолжает превосходить людей в таких базовых задачах, как понимание прочитанного и компьютерное программирование, растет озабоченность по поводу его влияния на обучение и академическую честность. Например, ценность традиционных эссе и других письменных оценок все больше ставится под сомнение, учитывая, что ИИ теперь может создавать тексты, которые часто превосходят по качеству большинство студенческих работ.

Другие опасения включают чрезмерную зависимость от чат-ботов, приводящую к поверхностному обучению, сокращение возможностей для саморефлексии и утрату студентами активности, в результате чего они становятся пассивными пользователями технологий, а не активными учащимися.

Университеты отреагировали на это, используя инструменты для обнаружения использования студентами генеративного ИИ. Однако эти инструменты оказались ненадежными. Это привело к краткосрочным решениям, таким как «стресс-тестирование» письменных оценок и их замена устными экзаменами, рукописными тестами или форматами рефлексии (портфолио и дневники; см. go.nature.com/43btcxf), а также более четкими рекомендациями о том, когда ИИ можно и нельзя использовать. Хотя эти меры помогают, их эффективность ограничена.

Вместо этого необходимо коренным образом переосмыслить подход к обучению и оценке. Здесь мы выделяем три многообещающих подхода к экзаменам, которые адаптируют существующие методы — такие как оценки на основе бесед — к эпохе ИИ. Эти стратегии направлены на содействие подлинному интеллектуальному развитию, обеспечивая при этом точное отражение понимания и навыков студентов в оценках.

Используйте другие виды оценки

Одним из краеугольных камней современного образования является принцип «писать – значит думать». Письмо – это нелинейный процесс, требующий искреннего участия, критического мышления и решения проблем. Все эти виды деятельности стимулируют интеллектуальное развитие человека.

Однако когда ИИ помогает студентам в написании текстов или генерирует их, становится практически невозможно определить, насколько конечный результат отражает собственное понимание и критическое мышление студента (см. go.nature.com/47tjv93). Эта неопределенность подрывает использование письма в качестве доказательства обучения.

Одним из способов стимулирования критического мышления является проведение структурированного диалога между студентом и преподавателем. Например, сократовский метод вопросов — это форма дисциплинированного исследования, которая помогает учащимся проработать сложные идеи, подвергнуть сомнению свои предположения и оценить достоверность информации. В Древней Греции интеллектуальный диалог ценился настолько высоко, что некоторые философы того времени выражали обеспокоенность тем, что чрезмерная зависимость от письма может ослабить человеческую память (см. go.nature.com/43grxsp).

Традиционные экзамены по-прежнему могут иметь место рядом с оценкой на основе искусственного интеллекта. Кредит: Jorge Gil/Europa Press via Getty
Традиционные экзамены по-прежнему могут иметь место рядом с оценкой на основе искусственного интеллекта. Кредит: Jorge Gil/Europa Press via Getty

Современная версия дискурсивного подхода, использовавшегося в Древней Греции, известная как оценка на основе беседы, уже несколько десятилетий применяется в начальном, среднем и высшем образовании. Например, AutoTutor, разработанный в Университете Мемфиса в Теннесси, используется для преподавания таких предметов, как ньютонова физика, одновременно улучшая навыки компьютерной грамотности и критического мышления. Он вовлекает студентов в разговоры на естественном языке и использует вычислительные методы для оценки их понимания, анализируя такие факторы, как точность, выбор слов и время, затраченное на ответ. Однако такие системы обычно имеют ограниченные разговорные возможности и по-прежнему в основном полагаются на простой анализ текста и обнаружение определенных слов и выражений.

Именно здесь интеграция ИИ может стать прорывом. ИИ может поддерживать открытый, контекстно-зависимый диалог гораздо более реалистичным образом, чем это могут сделать современные методы оценки, основанные на разговоре. Инструменты ИИ могут задавать студентам дополнительные вопросы, давать индивидуальные подсказки и адаптироваться к уровню знаний студента в режиме реального времени, обеспечивая гибкую и персонализированную поддержку в обучении. А его вопросы могут быть более разнообразными, чем в традиционных системах оценки разговора, которые обычно специализируются на конкретной области.

Важнейшая возможность ИИ заключается не только в автоматизации ответов на вопросы, но и в том, чтобы дать учащимся возможность учиться через общение с системами ИИ и использовать этот диалог в качестве формы оценки, делая его динамичным и персонализированным процессом.

Проблемы остаются. Во-первых, системы ИИ должны будут сбалансированно направлять разговоры, поощряя учащихся задавать вопросы, исследовать интересующие их темы и принимать активное участие в процессе обучения. В то же время диалог должен быть достаточно структурированным, чтобы система ИИ могла собрать значимые данные о понимании учащимися материала, например о том, как они рассуждают над проблемой, объясняют концепцию или применяют знания в контексте. Достижение этого баланса между открытым исследованием и измеримой оценкой остается одной из основных задач исследований.

Еще одной проблемой является недопонимание — системы ИИ могут неправильно понять намерения студента или предоставить неточную или вводящую в заблуждение информацию. В этом случае студентам может быть сложно определить причины своих ошибок. Высокая степень персонализации и открытый характер обучения и оценки на основе ИИ также затрудняют стандартизацию. Таким образом, традиционные формы оценки по-прежнему будут иметь место, особенно в процессе поступления в университет, где приоритетом является обеспечение единообразия и справедливости в отношении большого числа студентов.

Оценивайте непрерывно

Одной из ключевых проблем многих предлагаемых решений по поводу широкого внедрения ИИ в учебный процесс является то, что, несмотря на попытки защитить академическую честность, они по-прежнему работают в рамках модели экзаменов с высокими ставками. Даже если экзамен переформатирован в виде беседы, студенты по-прежнему осознают, что его результат имеет большое значение. Студенты считают экзамены с высокими ставками стрессовыми и могут показать низкие результаты или поддаться искушению списать. Таким образом, ключевой задачей является снижение необходимости в экзаменах с высокими ставками в эпоху искусственного интеллекта, когда списывать может стать проще.

Непрерывная оценка может быть эффективной альтернативой. Во многих академических областях срочно необходимо заменить экзамены в конце семестра серией взаимосвязанных оценок, которые дают полное представление об успеваемости студентов. Непрерывная оценка хорошо зарекомендовала себя в медицинском образовании. Например, во время клинической практики студенты-медики постоянно оцениваются руководителями, которые наблюдают за их клиническим мышлением, навыками работы в команде и общением с пациентами. Эти наблюдения в сочетании с письменными отзывами и оценками сокурсников создают целостную картину компетентности студента на протяжении времени. Однако такие модели остаются редкими в других дисциплинах, главным образом из-за увеличения нагрузки на преподавателей.

Растущая доступность систем на основе ИИ делает непрерывную оценку более осуществимой. Разговоры между студентами и ИИ-инструментом можно рассматривать не как разовые обмены, а как часть непрерывного процесса обучения, в котором многочисленные взаимодействия с низкими ставками постепенно создают богатую картину прогресса студентов.

Основная задача заключается в обеспечении того, чтобы системы ИИ могли эффективно отслеживать и анализировать этот прогресс в обучении. Существующие универсальные инструменты, такие как ChatGPT, Gemini и Copilot, не предназначены для этой цели — они не анализируют ответы учащихся в динамике, чтобы выявить прогресс или устойчивые заблуждения. Для реальной поддержки непрерывной оценки существует острая потребность в ориентированных на обучение платформах искусственного интеллекта, которые могут собирать продольные данные о результатах учащихся, предоставлять значимую информацию о траекториях обучения и легко интегрироваться в структуру курсов и программ.

Полученные качественные данные дадут более полное и целостное представление о прогрессе студентов, чем существующие подходы, поскольку такие данные будут учитывать конкретный уровень знаний и потребности студентов в развитии. Частые задания с низкой степенью риска также снижают стресс и соблазн списывать, поощряя подлинное участие. Исследования показывают, что оценки с низкой степенью риска, как правило, снижают академическую нечестность и тревожность студентов.

Цените навыки высшего порядка

Университетам, возможно, также необходимо сместить акцент на развитие у студентов навыков высшего порядка и межличностных навыков, таких как креативность, сотрудничество и эмпатия. Это области, в которых человеческие сильные стороны остаются ярко выраженными и ценными.

Вместо традиционных письменных экзаменов студенты могли бы, например, совместно разработать план устойчивого развития для своего университета, создать прототип продукта или проанализировать реальную политическую проблему. В отличие от сегодняшних групповых проектов, студентов можно было бы поощрять использовать инструменты ИИ на протяжении всего процесса — для генерации идей, анализа данных или структурирования презентаций — при этом платформа ИИ выступала бы в качестве авторизованного университетом партнера в обучении.

Было доказано, что ИИ помогает студентам во время совместных сессий мозгового штурма. Однако оценка того, приобретают ли студенты необходимые навыки высшего порядка, по-прежнему остается сложной задачей. Не существует единой системы оценки креативности, способности к сотрудничеству или критического мышления в различных дисциплинах, что затрудняет сравнение результатов или подтверждение эффективности ИИ как подлинного средства помощи в образовании.

Следующие шаги

Несмотря на то, что ИИ обладает огромным потенциалом для значительного улучшения обучения, многие важные вопросы остаются нерешенными.

Во-первых, преподаватели и студенты должны повысить свою грамотность в области ИИ. Преподаватели должны получать надлежащую поддержку — в виде профессионального развития, обучения и выделенного времени — для экспериментов с инструментами ИИ и их интеграции в свой учебный процесс. Студенты нуждаются в рекомендациях по безопасному и эффективному использованию ИИ, чтобы понимать его потенциал, ограничения и этические последствия.

Университеты также должны разработать четкую политику использования ИИ, способствующую ответственному и эффективному взаимодействию. Это потребует переосмысления того, что составляет оригинальность, критическое мышление и креативность в работе студентов.

Такая политика должна также учитывать растущее разнообразие приложений ИИ — от общих систем общения, таких как ChatGPT и Copilot, до специализированных инструментов для исследований (таких как Scite.AI), поддержки письма (например, Grammarly) и генерации изображений (таких как Adobe Firefly).

Учреждения должны также способствовать развитию культуры, поддерживающей продуманную интеграцию ИИ. Переосмысление обучения и оценки в таком масштабе потребует изменения отношения организации к ИИ. Успешное внедрение технологий в значительной степени зависит от того, насколько они соответствуют ценностям и убеждениям пользователей. В университетах восприятие ИИ как студентами, так и преподавателями определяет, насколько легко он принимается и используется. Поэтому инвестирование в грамотность в области ИИ в академической среде является не только технической, но и культурной необходимостью. Это важно для обеспечения того, чтобы ИИ улучшал, а не подрывал обучение и оценку.

Источник