Выделяют пять общих требований к тестам контроля знаний: валидность; определенность (общепонятность)
| Вид материала | Документы |
СодержаниеИспользование достаточных статистик |
- Фролова Е. В., Санжаровская, 148.22kb.
- Общих требований к ответу «5», 129.55kb.
- Система контроля знаний в преподавании русского языка и литературы, 101.79kb.
- Различные формы и методы контроля знаний учащихся Различные формы и методы контроля, 114.33kb.
- Общие рекомендации к составлению тестов компоновка тестов > Требования к тестам, 451.26kb.
- Методика преподавания иностранных языков располагает значительным теоретическим багажом, 63.9kb.
- Государственный университет Высшая школа экономики, 45.29kb.
- Положение о балльно-рейтинговой системе контроля знаний студентов Общие положения, 84.83kb.
- Конспекты лекций Тесты для контроля качества знаний Слайд-презентации, 36.6kb.
- Для многоуровневого контроля знаний студентов, 37.36kb.
Использование достаточных статистик
В рамках модели Раша первичные баллы участников тестирования
(i=1, 2, 3, ……N) и заданий
являются достаточными статистиками. Поэтому, если варианты теста являются параллельными, то участники, набравшие одинаковые первичные баллы получат одинаковые оценки подготовленности
в логитах. Это позволяет получить на единой метрической шкале в логитах (К-1) узловых точек [6]:
, b=1, 2, 3, …., К-1,где
- уровень подготовленности участников, выполнявших
вариант теста и набравших b баллов,
- количество таких участников (
- общее число участников по всем вариантам, набравшим по b баллов). Обозначим через
уровень трудности j- узлового задания, полученный при обработке матрицы ответов
- го варианта. Тогда для сведения всех уровней подготовленности, полученных по всем параллельным вариантам теста к единой метрической шкале можно использовать следующий алгоритм:с помощью критерия согласия необходимо проверить статистические гипотезы о возможности применения модели Раша для описания полученных экспериментальных результатов;
необходимо задать условное начало (ноль) метрической шкалы для всех вариантов. Для чего из всех оценок латентных параметров
и
вычитается значение
. Если бы модель Раша была бы полностью адекватна результатам тестирования, и отсутствовали бы ошибки измерений, то указанные смещения привели бы к полному совпадению значений
, соответствующих одному и тому же значению первичного балла для любых вариантов теста, что является на практике маловероятным;необходимо усреднить оценки подготовленности
, соответствующие одинаковому первичному баллу b по различным вариантам теста и подсчитать дисперсии значений
(
). Для одного (любого) варианта и дисперсию усредненного значения
(
):
, b=1, 2, 3, …… К-1,

Однако необходимо убедиться, что максимальное уклонение
от
не противоречит гипотезе о равенстве математических ожиданий
для любых параллельных вариантов теста.Числа
делят метрическую шкалу в логитах на К промежутков, каждому из которых можно приписать номер от 1 до К. Чтобы перенести на единую метрическую шкалу трудность
j – задания (j=1, 2, 3, ….. К) в
- варианте (
), попадающую на промежуток с определенным номером, необходимо сделать линейную интерполяцию:
,
и
- уклонения реально полученных оценок уровня подготовленности в
варианте от усредненных значений,
- исправленная трудность. Недостатком данного подхода является то, что при линейной интерполяции копируется погрешность узловых значений уровней трудности заданий. Необходимо сглаживать эту погрешность, например можно аппроксимировать каждую функцию
, заданную дискретно в (К-1) точках
, кубическим сплайном
(с учетом точности характеристик исходных значений
) [29]. Тогда исправленное значение латентного параметра уровня трудности задания можно представить следующим образом:
.Далее используя исправленные значения уровней подготовленности участников тестирования (
), приведенные к единой метрической шкале можно определить их окончательный балл.