Выделяют пять общих требований к тестам контроля знаний: валидность; определенность (общепонятность)
Вид материала | Документы |
СодержаниеПеренос результатов тестирования различных выборок испытуемых на метрическую шкалу Использование перекрытия вариантов тестов |
- Фролова Е. В., Санжаровская, 148.22kb.
- Общих требований к ответу «5», 129.55kb.
- Система контроля знаний в преподавании русского языка и литературы, 101.79kb.
- Различные формы и методы контроля знаний учащихся Различные формы и методы контроля, 114.33kb.
- Общие рекомендации к составлению тестов компоновка тестов > Требования к тестам, 451.26kb.
- Методика преподавания иностранных языков располагает значительным теоретическим багажом, 63.9kb.
- Государственный университет Высшая школа экономики, 45.29kb.
- Положение о балльно-рейтинговой системе контроля знаний студентов Общие положения, 84.83kb.
- Конспекты лекций Тесты для контроля качества знаний Слайд-презентации, 36.6kb.
- Для многоуровневого контроля знаний студентов, 37.36kb.
Перенос результатов тестирования различных выборок испытуемых на метрическую шкалу
Обычно в практике тестирования приходится использовать большое число параллельных тестов. В основном, это связанно с необходимостью защиты базы тестов от тиражирования правильных ответов среди участников тестирования. Однако в этом случае возникает необходимость сопоставления результатов, полученных по параллельным формам тестов, что является непростой задачей.
Рассмотрим случай, когда N участников тестирования выполняют M различных вариантов теста, состоящего из К заданий. Пусть участников выполняли задание - го варианта:
.
Таким образом, в результате тестирования будет получено М различных матриц ответов , каждая из которых имеет размерность . Предположим, что полученные результаты по каждой из матриц ответов подчиняются однопараметрической модели Раша. Тогда в результате математической обработки ответов могут быть получены оценки латентных параметров трудности заданий и уровня подготовленности , а также оценки соответствующих среднеквадратичных ошибок и , и коэффициента дискриминации (разрешающей способности) заданий. Располагая полученными оценками, необходимо выставить каждому i- участнику определенный окончательный балл , находящейся в интервале от 0 до 100, но при этом возникает ряд трудностей.
Латентные параметры трудности заданий и уровней подготовленности участников , полученные для каждого из вариантов, относятся к метрическим, но не нормированным шкалам (можно измерить расстояния между параметрами в логитах, но нельзя измерить расстояния параметров от начала отсчета). Все отсчеты по таким шкалам можно сдвигать без потери информации. Для сведения всех результатов к единой шкале необходимо перекрытие заданий (одни и те же задания выполняют различные участники) или участников (одни и те же участники выполняют различные задания) в различных вариантах теста. И тот, и другой подход часто используется на практике.
Использование перекрытия вариантов тестов
При данном подходе все варианты тестов должны иметь общие задания (не менее 3 [6,27,28]) с примерно одинаковым уровнем трудности, причем эти задания должны делить всю шкалу трудности заданий примерно на равные интервалы. Подобные задания получили название узловых (или якорных) заданий. Предположим, что у нас имеется три одинаковых для всех вариантов теста задания с уровнями сложности , и . Верхний индекс в круглых скобках определяет взаиморасположение трудностей заданий. Для создания единой метрической шкалы по всем вариантам теста необходимо:
с помощью критерия согласия проверить статистические гипотезы о возможности применения модели Раша для описания полученных экспериментальных результатов;
задать условное начало (ноль) метрической шкалы для всех вариантов, для чего из всех оценок латентных параметров и вычитается значение . Если бы модель Раша была бы полностью адекватна результатам тестирования, и отсутствовали бы ошибки измерений, то трудности и совпадали бы для любых вариантов теста, что является на практике маловероятным;
усреднить трудности первого и третьего узловых заданий, полученные по разным вариантам с учетом соответствующих точностей (т.е. вычисляются средние весовые значения):
, ,
Здесь и - соответственно веса оценок и , j- номер узловых заданий в вариантах теста, - номер варианта теста (от 1 до М), С - произвольная константа.
В конечном итоге трудностям узловых заданий приписывают следующие усредненные значения:
, ,
Точность усреднения разностей , , и можно оценить соответствующими дисперсиями:
, ,
где и определяют дисперсии весовых единиц, а и уклонения для каждого из вариантов. Дисперсии тех же разностей, но не усредненных, а полученных по результатам тестирования по одному варианту вычисляются следующим образом:
,
Исправленные значения латентных параметров трудности заданий и уровня подготовленности, испытуемых и , необходимые для перевода результатов полученных по разным вариантам теста к единой метрической шкале находят по следующим формулам:
если , то ;
если , то ;
если , то ;
если , то .
Используя исправленные значения уровней подготовленности участников тестирования, приведенные к единой метрической шкале можно определить их окончательный балл по формуле:
,
где - окончательный тестовый балл на 100 бальной шкале, - среднее значение исправленного уровня подготовленности, - исправленный уровень подготовленности i – участника, - среднеквадратичное отклонение, - некоторые эмпирические коэффициенты подбираемые вручную (например , ).