Найти в Дзене

Тесты. Типы тестов. Процедура разработки различных видов тестовых заданий

1. Понятие «тест», «дидактический тест» Тест: 1) Испытание, эксперимент, проверка. 2) Система заданий стандартной формы, выполнение которых проходит в равных для всех испытуемых условиях, поддается количественному учету (оценке), позволяет установить уровень сформированности знаний, навыков, умений тестируемого. Дидактический тест - система сертифицированных дидактических тестовых ситуаций, предназначенная для установления степени обученности конкретного индивида. 2. Классификация тестов Тест множественного выбора (задание закрытой формы) - форма тестового задания, при выполнении которого испытуемый выбирает ответ из нескольких предложенных вариантов, при этом только один из вариантов ответов правильный, остальные – отвлекающие. Тест на выполнение - тест на выполнение которого отводится столько времени, чтобы все испытуемые закончили работу. Разновидность теста на выполнение – тест на сложность. Тест на систематизацию (задание на установление правильной последовательности) - форма тест

1. Понятие «тест», «дидактический тест»

Тест: 1) Испытание, эксперимент, проверка. 2) Система заданий стандартной формы, выполнение которых проходит в равных для всех испытуемых условиях, поддается количественному учету (оценке), позволяет установить уровень сформированности знаний, навыков, умений тестируемого.

Дидактический тест - система сертифицированных дидактических тестовых ситуаций, предназначенная для установления степени обученности конкретного индивида.

2. Классификация тестов

Тест множественного выбора (задание закрытой формы) - форма тестового задания, при выполнении которого испытуемый выбирает ответ из нескольких предложенных вариантов, при этом только один из вариантов ответов правильный, остальные – отвлекающие.

Тест на выполнение - тест на выполнение которого отводится столько времени, чтобы все испытуемые закончили работу. Разновидность теста на выполнение – тест на сложность.

Тест на систематизацию (задание на установление правильной последовательности) - форма тестового задания, выполнение которого состоит в установлении правильной последовательности операций, действий, событий.

Тест на скорость - тест, состоящий из заданий одинаковой трудности; оценка за тест определяется количеством выполненных заданий в строго ограниченное время, в отличие от теста на выполнение и теста на сложность, то есть индивидуальные различия определяются скоростью выполнения заданий. Сложность заданий такого теста невелика, но лимит времени устанавливается так. Что никто не успевает выполнить все задания. Таким образом, тест на скорость строится так, чтобы испытуемому нельзя было получить высший результат.

Тест на сложность (тест возможностей) - тест, состоящий из заданий возрастающей трудности. Номер последнего выполненного задания является качественной характеристикой учебной успешности тестируемого.

Тест на соответствие (задание на соответствие, тест перекрестного выбора) - форма тестового задания, при выполнении которого необходимо установить соответствие между элементами двух множеств (двух списков, рядов).

Тест профессионально-ориентированный (модульный тест) - система тестовых заданий, проверяющих уровень владения тестируемым материалом, необходимым для общения в учебно-научной (учебно-профессиональной) сфере деятельности.

Основными отличиями тестов от прочих способов выявления индивидуальных различий, таких как наблюдение, анализ документов или продуктов деятельности и др. являются их формализованность и более высокая степень объективности проводимого с их помощью оценивания, которая обеспечивается за счет стандартизации вопросов и ответов, особой процедуры проведения тестирования и способов обработки результатов. Практически все современные тесты создаются на основе математической теории оценки качества заданий и параметров личности.

Тесты как инструмент оценивания имеют значительные отличия от контрольных работ. Во-первых, тесты – значительно более качественный и объективный способ оценивания и, во-вторых, что наиболее важно и принципиально, показатели тестов ориентированы на измерение степени, определение уровня усвоения ключевых понятий, тем и разделов учебной программы, умений, навыков и пр., а не на констатацию наличия у учащихся определенной совокупности формально усвоенных знаний. Стандартизированная форма оценки, используемая в тестах, позволяет соотнести уровень достижений учащегося по предмету в целом и по отдельным его разделам со средним уровнем достижений учащихся в классе и уровнями достижений каждого из них.

Для того, чтобы дать наиболее полную характеристику тестов и определить их место, значение, взаимосвязи в общей системе тестовых методик, необходимо дать представление о существующих на данный момент видах тестов. Тесты могут быть классифицированы по следующим основаниям с выделением соответствующих видов:

1. По процедуре могут быть выделены стандартизированные и нестандартизированные тесты. Стандартизация психологами понимается в двух аспектах:

стандартизация процедуры и условий проведения тестирования, способов обработки и интерпретации результатов, которые должны привести к созданию равных условий для испытуемых и минимизировать случайные ошибки и погрешности, как на этапе проведения, так и на этапе обработки результатов и интерпретации данных;

стандартизация результатов, то есть получение нормы, шкалы оценки, которая служит основанием для определения уровня овладения тем, что выясняет данный тест, при этом не важно, какого рода нормы получаются и какие шкалы используются.

Многие специалисты-тестологи вообще не считают возможным рассматривать так называемые нестандартизированные тесты как вид тестов, так как на их взгляд, стандартизированность является необходимой особенностью, определяющей сущность теста, как диагностической методики, его характеристикой. Важно разделить эти два понятия. Поэтому тесты нестандартизированные по результатам мы будем называть ненормированными, а тесты нестандартизированные по процедуре – нестандартизированными.

Это важно, поскольку в педагогике можно выделить ряд задач, которые могут быть решены ненормированными тестами. Однако при этом необходимо учитывать несколько существенных обстоятельств. Сфера применения ненормированного инструмента ограничена: с точки зрения субъекта – разработчиком теста, а объекта – той группой учеников, с которыми он в состоянии работать. Круг задач для ненормированных тестов – частные, специальные методические и узкометодические. Например, оценка качества усвоения материала той или иной темы, выявление усвоенных понятий, определений данной темы и т. д. Вторая область применения ненормированных гестов – сравнительные исследования групп учащихся в тех же узких областях. Однако при сравнительных исследованиях необходимость получения оценок и их сравнения приводит к необходимости нормирования в той или иной мере.

Необходимо сделать еще одно замечание: правила и требования к составлению заданий и их качеству остаются едиными для любых, в том числе и ненормированных и нестандартизированных тестов. Конечно, надежные результаты дает применение стандартизированных тестов. Результаты, полученные с помощью нестандартизированных тестов, малонадежны и требуют подтверждения.

  1. Классификация тестов по назначению:

общедиагностические (тесты личности по типу вопросников Кеттелла или Айзенка, тесты общего интеллекта Векслера, Бине-Симона в редакции Термена и Меррила и др.);

профессиональной пригодности (множество общих классификационных тестов – общий армейский классификационный тест, классификационные тесты способностей Фланагана и др.);

специальных способностей (технических, музыкальных, тесты для пилотов, радиооператоров и т. д.);

достижений (например, произношения, качества написания письменных сочинений и т.п. т. е. тесты, предназначенные для оценивания результатов, достигнутых учащимися в процессе обучения.).

  1. По средствам, используемым в процессе тестирования:

бланковые (тесты «бумага и карандаш», в которых используются тестовые тетради или бланки, в которых испытуемые отмечают или вписывают правильные ответы – вопросники личности, тест механической понятливости Беннета, большинство тестов достижений и др.);

предметные (в которых необходимо манипулировать материальными объектами, результативность выполнения этих тестов зависит от скорости и правильности выполнения заданий – кубики Косса, тест Стенквиста на сборку конструкций и узлов деталей, тест «Сложение фигур» из набора Векcлера и др.);

аппаратурные (тесты с использованием устройств для изучения особенностей внимания, восприятия, памяти и мышления – «детектор лжи», аппарат для определения энцефалограмм мозга и др.);

практические (появившиеся относительно недавно, эти тесты схожи с известными у нас лабораторными работами – по химии, физике, биологии и пр., – однако они снабжены соответствующими инструкциями и имеют тестовое оснащение);

программные (тесты с применением программ ЭВМ).

4. По количеству одновременно обследуемых людей:

индивидуальные (тесты Векслера, тест Люшера и др.);

групповые (большинство стандартизованных вопросников, оценивающих основные характеристики личности, набор тестов Фланагана, большинство тестов достижений и т. д.).

5. По форме ответа тесты делятся:

устные;

письменные;

с применением ЭВМ.

6. По ведущей ориентации:

тесты скорости, содержащие простые задачи, время решения которых ограничено настолько, что ни один испытуемый не успевает решить все задачи в заданное время (Кольца Ландольта, Бурдона, «шифровка» из набора Векслера);

тесты мощности или результативности, включающие трудные задачи, время решения которых либо вовсе не ограничено, либо мягко лимитировано. Оценке подлежит успешность и способ решения задачи. Примером такого рода тестовых заданий могут быть задания для письменных итоговых экзаменов за курс школы;

смешанные тесты, которые объединяют в себе черты двух вышеперечисленных. В таких тестах представлены задачи различного уровня сложности: от самых простых до очень сложных. Время испытания в данном случае ограничено, но достаточное для решения предлагаемых задач большинством обследуемых. Оценкой в данном случае служат как скорость выполнения заданий (количество выполненных заданий), так и правильность решения. Эти тесты наиболее часто применяются на практике.

7. По степени однородности задач:

гомогенные, имеющие, как правило, одну шкалу, которые позволяют оценить одно свойство или качество личности и включают задачи, сходные по характеру, но различающиеся конкретным содержанием;

гетерогенные, имеющие несколько шкал, которые позволяют оценить разнообразные характеристики личности и включают задания, отличающиеся как по характеру, так и по содержанию.

8. По характеру действий:

вербальные (связанные с необходимостью произведения умственных действий – словесно-логические тесты, вопросники на проверку знаний, установление закономерностей и пр.);

невербальные (связанные с практическим манипулированием предметами – карточками, блоками, деталями).

9. По направленности, т.е. по тому, что именно предполагается изучать с помощью данного теста:

тесты интеллекта, выявляющие особенности последнего;

личностные тесты (иногда называемые тестами темперамента), с помощью которых изучаются особенности личности испытуемого; тесты настроении и состояний, направленные на изучение временных состояний, таких как эмоции;

другие.

10. По виду нормирования:

ориентированные на статистические нормы – тесты, основанием для сравнения в которых служат соответствующим образом обоснованные статистически полученные значения выполнения данного теста репрезентативной выборкой испытуемых;

критериально ориентированные – тесты, предназначенные для определения уровня индивидуальных достижений испытуемого относительно некоторого заданного критерия, существующего в реальной практике и заранее известного уровня знаний, умений, навыков, необходимых для выполнения определенного вида деятельности. Критерий может быть определен на основании экспертной оценки (например, критерий школьной успешности может быть определен путем опроса педагогов, работающих в данном классе или с данным ребенком) либо практической деятельности испытуемых (критерий школьной успешности может быть определен по оценкам за четверть или год);

прогностические, ориентированные на успешность дальнейшей деятельности;

ненормированные.

11. По характеру ответов на вопросы:

открытого типа (со свободными ответами – когда испытуемому необходимо самостоятельно дописать слово, словосочетание, предложение, знак, формулу и т. д.)

закрытого типа (с предписанными ответами – когда испытуемому необходимо выбрать из предложенных вариантов ответов тот или иной вариант).

Кроме этого, выделяют следующие возможные варианты ответов, используемые в тестах открытого типа:

задания дополнения – испытуемый должен сформулировать ответы с учетом предусмотренных в задании ограничений;

свободного изложения – испытуемый должен самостоятельно сформулировать ответы, ибо никакие ограничения на них в задании не накладываются.

Варианты тестов закрытого типа:

альтернативных ответов, испытуемый должен ответить «да» или «нет»;

соответствия (на восстановление соответствия) – испытуемому предлагается восстановить соответствие элементов двух списков;

множественного выбора (ответы с вариантами выбора) – испытуемому необходимо выбрать, как правило, один правильный ответ из приведенного списка возможных ответов;

исключения лишнего (устранения лишнего элемента, «встретил лишнее – убери»);

аналогии – испытуемый должен выделить отношение аналогии между парами элементов (слов, свойств, качеств и т. д.);

последовательности (на завершение последовательности) – испытуемый должен запершить некоторую последовательность элементов.

Кроме классификации по приведенным выше одиннадцати основаниям, можно выделить, так называемые, «объективные» тесты – тесты, объективность оценки результатов которых обусловливается тем обстоятельством, что в процессе обработки результатов тестирования не предусматривается использование их субъективных толкований тестирующим.

Проективные тесты – совокупность методик, разработанных в рамках проективного подхода в психологии, характеризующихся неопределенностью, неоднозначностью используемых в ходе тестирования стимулов, что допускает чрезвычайно большое разнообразие ответов и проявление определенной субъективности при их толковании тестирующим; индивидуально ориентированные тесты, специально создаваемые или являющиеся модификацией уже известных, но предназначенные для обследования определенного испытуемого.

Тесты достижений среди прочих психодиагностических методик составляют одну из самых многочисленных групп. В свою очередь среди них выделяют:

широкоориентированные, позволяющие оценить эффективность процесса обучения по степени реализации одной из его основных целей, то есть степени освоения учащимися системы знаний, умений и навыков в ходе учебного процесса;

узкоориентированные, направленные на выявление достижений учащихся в процессе освоения отдельных предметов, отдельных тем и т. д.

3. Требования к составлению теста

Тестирование является обязательным этапом итогового контроля изучения дисциплины (экзамена или зачета).

Содержание тестовых заданий должно соответствовать конечным целям изучения дисциплины. Они должны выявлять знание общих, принципиальных, положений дисциплины, определенные конечными целями изучения. Недопустимы задания на выявление знаний «мелких» частных и справочных сведений.
Задания на выявление умственных умений, перечисленных в конечных целях изучения дисциплины, должны составлять не менее половины заданий экзаменационного теста.

Экзаменационный тест должен быть сертифицирован – его валидность, надежность должны быть подтверждены математическими методами.

Результаты тестирования студента оцениваются «зачтено» если студент набрал 60% и более процентов максимального балла теста.

Требования к тестовым заданиям по дисциплине

1. Содержание тестовых заданий должно соответствовать системе целей изучения дисциплины – целям тем, разделов, конечным целям дисциплины.

2. Тестовое задание должно соответствовать одной из форм:

- с выбором правильных ответов

– допускающих выбор только одного элемента из множества

– позволяющих выбрать одновременно несколько элементов, недопустима ситуация, когда все перечисленные заключения являются либо правильными или неверными

открытой на установление соответствия

- на установление правильной последовательности

3. Задание должно быть в виде логического высказывания, кратким, однозначным, сопровождаться адекватной инструкцией для выполнения.

4. Тестовое задание должно быть представлено в форме краткого суждения, сформулированного четким языком и исключающего неоднозначность заключения тестируемого на требования тестового задания.

5. Содержание тестового задания НЕ должно содержать повторов, двойных отрицаний и сленга.

6. Формулировка тестового задания должна быть выражена в повествовательной форме (вопрос исключается)

7. В формулировке ТЗ не должно быть повелительного наклонения (выберите, вычислите, укажите и т.д.)

8. Недопустимы заключения типа: все выше перечисленное верно, все указанные ответы неверны и т.д.

9. Ни в тексте, ни в ответах не должно быть подсказок.

10. Следует избегать тестовых заданий, которые требуют от выпускников развернутых заключений на требования тестовых заданий (лучше «длинный» вопрос и «короткие» ответы, чем наоборот).

11. В тестовом задании не должно отображаться субъективное мнение или понимание отдельного автора.

4. Тесты достижений, их типы и характеристика

Тест (учебных) достижений (Т.у.д.)- система тестовых заданий, измеряющих уровень обученности учащихся за определенный отрезок времени при итоговом и завершающем контроле.

Т. у. д. предназначены для измерения специфических эффектов программы обучения. В целом, они представляют собой итоговую оценку того, что было выучено или приобретено уч-ся. Напр., заключительный экзамен, сдаваемый уч-ся после прохождения курса алгебры, вполне можно было бы отнести к тестам достижений. Иногда ошибочно смешивают Т. у. д. с тестами способности к обучению. Последние определяются как тесты, измеряющие уровень овладения учащимися совокупностью знаний, умений и навыков к настоящему моменту, с тем чтобы можно было спрогнозировать успешность их последующего обучения.

Есть два основных типа Т. у. д.: стандартизованные Т. у. д. и Т. у. д., создаваемые учителем для проведения в своем классе. Определение «стандартизованный» предполагает, что тест проводится при одинаковых условиях, — напр., при одинаковом для всех времени на его выполнение, - и потому результаты проведения таких тестов в разных группах можно сравнивать. Разработка стандартизованных тестов требует значительного времени и усилий специалистов, однако при этом рядовые пользователи обеспечиваются разнообразной информацией и данными для сравнения. В отличие от стандартизованных, учительские тесты измеряют достижение тех учебных целей, которые должны быть реализованы благодаря определенной порции обучения. Вопросы таких тестов основаны на излагаемом учителем материале и нацелены на определение того, насколько хорошо он усвоен каждым учеником в классе. В то время как учительские тесты широко используются в обучении и выполняют в нем незаменимую функцию, стандартизованное тестирование позволяет время от времени проводить точные и осмысленные сравнения разных учащихся и получаемого ими обучения.

Большая часть школ пользуется одной из форм общей батареи Т. у. д., применяемой на протяжении всех лет начального и среднего обучения. Наиболее широко используются тестовые батареи, измеряющие учебные навыки и знание содержания таких предметов, как чтение, арифметика, родной язык и трудовое обучение. В настоящее время существует множество тестов для измерения как общего образовательного уровня, так и достижений в конкретных учебных предметах. С квалифицированными обзорами и оценками большинства издаваемых Т. у. д. можно познакомиться в Ежегодниках психических измерений О. К. Буроса. На уровне высшего образования, принятая Советом колледжей Программа опережающего отбора (АРР)разрабатывает Т. у. д. по разнообразным дисциплинам с целью помочь уч-ся поступить в колледж на основании особых успехов в изучении одного или нескольких предметов. Кроме того, Программа экзаменов университетского уровня (CLEP), также проводимая Советом колледжей, облегчает получение «кредитов» колледжа по набору преподаваемых в нем дисциплин на основе результатов проверки знаний, полученных людьми благодаря самообразованию и др. нетрадиционным формам.

Еще один подход к тестированию учебных достижений - критериально-ориентированное тестирование - несмотря на сравнительную новизну получает все более широкое использование для оценивания образовательных достижений. По существу, критериальный тест показывает тот уровень, на котором тестируемый способен выполнять критериальную деятельность. Задания такого теста прямо увязываются с теми конкретными образовательными целями, которых учащийся должен достичь в процессе обучения. Поэтому оценки по тесту отражают конкретные достижения тестируемого после прохождения курса обучения. В сущности, те же цели преследуют и учительские тесты. Однако, в критериальном тесте присутствует гораздо большая четкость и последовательность в увязывании учебных целей данной программы обучения с последующим измерением их достижения. В этом тесте часто устанавливается минимальный (критический) уровень достижения, причем не на основе какого-либо произвольно выбранного показателя, напр. 70%, а исходя из минимального уровня компетентности, расцениваемого экспертами в качестве приемлемого. Возрастающее значение, которое придается в системе образования минимальным уровням компетентности для вынесения конкретной оценки уч-ся или для выдачи диплома об окончании высшего учебного заведения, сулит перспективы дальнейшему развитию критериального тестирования.

5. Процедура разработки тестовых заданий

Педагогический тест (сокр. «тест») - репрезентативная педагогическая система параллельных заданий возрастающей трудности, специфической формы, позволяющая качественно оценить структуру и измерить уровень подготовленности испытуемых.

Тест надо рассматривать как единство: 1) метода педагогического измерения; 2) результатов, полученных определенным методом (матрица данных); 3) интерпретированных результатов, полученных определенным методом. Тест - это творческое соединение метода и правильно интерпретированных результатов его применения.

Качественный тест образует шкалу, которая может быть определена как средство для измерения свойств объектов.

Все три понятия - задание в тестовой форме, тестовое задание и тест - соответствуют трем основным этапам разработки педагогических тестов:

1. Разработка заданий в тестовой форме.

2. Создание тестовых заданий (статистическая проверка заданий, с целью отбора их в качестве тестовых заданий).

3. Моделирование, конструирование теста из тестовых заданий.

Тест состоит не из заданий в тестовой форме, не из вопросов и задач, а только из тестовых заданий.

Тестовое задание - это составная единица теста, отвечающая всем требованиям к заданиям в тестовой форме (технологичности, чистоты формы и предметного содержания) и, кроме того, статистическим требованиям:

1) известной (меры) трудности;

2) дифференцирующей способности (достаточной вариации тестовых баллов);

3) положительной корреляции баллов испытуемых по заданию с баллами по всему тесту (сокращ. - корреляция задания с критерием)

4) а также другим математико-статистическим требованиям, которые в данной инструкции опускаются («подходящий геометрический образ задания» и т.д.).

Из перечисленных требований вытекает обязательность эмпирической проверки заданий на выборочной совокупности испытуемых и применения статистических методов обработки данных.

Тестовый балл испытуемого — суммирование всех баллов, полученных испытуемым, дает число правильных ответов. Это число ассоциируется с уровнем его знаний.

6. Достоинства и недостатки тестирования

На современном этапе при оценке знаний обучаемых используется такая форма контроля знаний, как тестирование. Несмотря на то, что многие преподаватели интуитивно правильно понимают процесс тестового контроля, необходимо дать четкое определение педагогического теста. Это позволит избежать терминологической путаницы и очертить границы предмета исследования.

При кажущемся разнообразии все определения педагогического теста близки между собой. Наиболее существенным для нас в них представляется то, что тест, в педагогическом понимании этого слова, означает проверку, испытание. Но это не простое установление факта наличия или отсутствия какого-либо качества или свойства. Педагогический тест – специфический инструмент, служащий средством для контроля уровня подготовленности обучаемого в соответствии с образовательным стандартом.

Если сравнивать тестовую форму контроля с наиболее распространенной в ВУЗах формой экзамена-диалога «преподаватель-студент», то она обладает целым рядом преимуществ.

Работа по тестовой методике показала, что тесты – более качественный и объективный способ оценивания обучаемых, позволяющий выявить степень овладения ими конкретными знаниями, умениями, навыками, а также позволяющий соотнести уровень достижений обучаемых по отдельному предмету в целом и по его отдельным разделам.

Тестовые задания развивают мышление обучаемых, так как от них требуется не только выбрать правильный ответ, но и серьезно проанализировать их. Тестовый контроль позволяет также определить, насколько усвоен каждый вопрос изученной темы, и внести коррективы в учебный процесс.

Основные недостатки применения тестов для коррекции учебной программы – это относительная трудность создания хорошего теста, проверенного эмпирически, имеющего устойчивые коэффициенты валидности и надежности и малое количество специалистов по тестированию. Эти недостатки в нашем случае мы можем компенсировать количеством специалистов, которые участвуют в создании теста. Достоинства же гораздо весомее. Тем более что отсутствие при проведении тестирования возможности для использования диалога обучаемого с преподавателем в общем относят к недостаткам. В нашем же случае это будет являться достоинством, так как космонавт в реальном полете предоставлен сам себе и выбор правильного решения он должен научиться осуществлять самостоятельно. И результатом тестирования, в нашем случае, будет количество часов, необходимое для обучаемого, чтобы совместно с преподавателем повторить материал. Это поможет более чем в два раза сократить время на повторное изучение материала при успешном результате тестирования.