Выделяют пять общих требований к тестам контроля знаний: валидность; определенность (общепонятность)

Вид материалаДокументы

Содержание


Перенос результатов тестирования различных выборок испытуемых на метрическую шкалу
Использование перекрытия вариантов тестов
Подобный материал:
1   2   3   4   5   6   7   8   9   10   11

Перенос результатов тестирования различных выборок испытуемых на метрическую шкалу



Обычно в практике тестирования приходится использовать большое число параллельных тестов. В основном, это связанно с необходимостью защиты базы тестов от тиражирования правильных ответов среди участников тестирования. Однако в этом случае возникает необходимость сопоставления результатов, полученных по параллельным формам тестов, что является непростой задачей.

Рассмотрим случай, когда N участников тестирования выполняют M различных вариантов теста, состоящего из К заданий. Пусть участников выполняли задание - го варианта:


.


Таким образом, в результате тестирования будет получено М различных матриц ответов , каждая из которых имеет размерность . Предположим, что полученные результаты по каждой из матриц ответов подчиняются однопараметрической модели Раша. Тогда в результате математической обработки ответов могут быть получены оценки латентных параметров трудности заданий и уровня подготовленности , а также оценки соответствующих среднеквадратичных ошибок и , и коэффициента дискриминации (разрешающей способности) заданий. Располагая полученными оценками, необходимо выставить каждому i- участнику определенный окончательный балл , находящейся в интервале от 0 до 100, но при этом возникает ряд трудностей.

Латентные параметры трудности заданий и уровней подготовленности участников , полученные для каждого из вариантов, относятся к метрическим, но не нормированным шкалам (можно измерить расстояния между параметрами в логитах, но нельзя измерить расстояния параметров от начала отсчета). Все отсчеты по таким шкалам можно сдвигать без потери информации. Для сведения всех результатов к единой шкале необходимо перекрытие заданий (одни и те же задания выполняют различные участники) или участников (одни и те же участники выполняют различные задания) в различных вариантах теста. И тот, и другой подход часто используется на практике.


Использование перекрытия вариантов тестов



При данном подходе все варианты тестов должны иметь общие задания (не менее 3 [6,27,28]) с примерно одинаковым уровнем трудности, причем эти задания должны делить всю шкалу трудности заданий примерно на равные интервалы. Подобные задания получили название узловых (или якорных) заданий. Предположим, что у нас имеется три одинаковых для всех вариантов теста задания с уровнями сложности , и . Верхний индекс в круглых скобках определяет взаиморасположение трудностей заданий. Для создания единой метрической шкалы по всем вариантам теста необходимо:

с помощью критерия согласия проверить статистические гипотезы о возможности применения модели Раша для описания полученных экспериментальных результатов;

задать условное начало (ноль) метрической шкалы для всех вариантов, для чего из всех оценок латентных параметров и вычитается значение . Если бы модель Раша была бы полностью адекватна результатам тестирования, и отсутствовали бы ошибки измерений, то трудности и совпадали бы для любых вариантов теста, что является на практике маловероятным;

усреднить трудности первого и третьего узловых заданий, полученные по разным вариантам с учетом соответствующих точностей (т.е. вычисляются средние весовые значения):


, ,


Здесь и - соответственно веса оценок и , j- номер узловых заданий в вариантах теста, - номер варианта теста (от 1 до М), С - произвольная константа.

В конечном итоге трудностям узловых заданий приписывают следующие усредненные значения:


, ,

Точность усреднения разностей , , и можно оценить соответствующими дисперсиями:


, ,


где и определяют дисперсии весовых единиц, а и уклонения для каждого из вариантов. Дисперсии тех же разностей, но не усредненных, а полученных по результатам тестирования по одному варианту вычисляются следующим образом:


,


Исправленные значения латентных параметров трудности заданий и уровня подготовленности, испытуемых и , необходимые для перевода результатов полученных по разным вариантам теста к единой метрической шкале находят по следующим формулам:


если , то ;


если , то ;


если , то ;


если , то .


Используя исправленные значения уровней подготовленности участников тестирования, приведенные к единой метрической шкале можно определить их окончательный балл по формуле:


,


где - окончательный тестовый балл на 100 бальной шкале, - среднее значение исправленного уровня подготовленности, - исправленный уровень подготовленности i – участника, - среднеквадратичное отклонение, - некоторые эмпирические коэффициенты подбираемые вручную (например , ).