Подобный материал:
- Фролова Е. В., Санжаровская, 148.22kb.
- Общих требований к ответу «5», 129.55kb.
- Система контроля знаний в преподавании русского языка и литературы, 101.79kb.
- Различные формы и методы контроля знаний учащихся Различные формы и методы контроля, 114.33kb.
- Общие рекомендации к составлению тестов компоновка тестов > Требования к тестам, 451.26kb.
- Методика преподавания иностранных языков располагает значительным теоретическим багажом, 63.9kb.
- Государственный университет Высшая школа экономики, 45.29kb.
- Положение о балльно-рейтинговой системе контроля знаний студентов Общие положения, 84.83kb.
- Конспекты лекций Тесты для контроля качества знаний Слайд-презентации, 36.6kb.
- Для многоуровневого контроля знаний студентов, 37.36kb.
Использование достаточных статистик
В рамках модели Раша первичные баллы участников тестирования
![](images/148245-nomer-m4b1e6f5e.gif)
(i=1, 2, 3, ……N) и заданий
![](images/148245-nomer-med719c4.gif)
являются достаточными статистиками. Поэтому, если варианты теста являются параллельными, то участники, набравшие одинаковые первичные баллы получат одинаковые оценки подготовленности
![](images/148245-nomer-m6e15e958.gif)
в логитах. Это позволяет получить на единой метрической шкале в логитах (К-1) узловых точек [6]:
![](images/148245-nomer-78235f38.gif)
, b=1, 2, 3, …., К-1,
где
![](images/148245-nomer-m409ebd84.gif)
- уровень подготовленности участников, выполнявших
![](images/148245-nomer-m2476bd8f.gif)
вариант теста и набравших b баллов,
![](images/148245-nomer-m1d209335.gif)
- количество таких участников (
![](images/148245-nomer-639adfb3.gif)
- общее число участников по всем вариантам, набравшим по b баллов). Обозначим через
![](images/148245-nomer-32705219.gif)
уровень трудности j- узлового задания, полученный при обработке матрицы ответов
![](images/148245-nomer-m2476bd8f.gif)
- го варианта. Тогда для сведения всех уровней подготовленности, полученных по всем параллельным вариантам теста к единой метрической шкале можно использовать следующий алгоритм:
с помощью критерия согласия необходимо проверить статистические гипотезы о возможности применения модели Раша для описания полученных экспериментальных результатов;
необходимо задать условное начало (ноль) метрической шкалы для всех вариантов. Для чего из всех оценок латентных параметров
![](images/148245-nomer-m5603a869.gif)
и
![](images/148245-nomer-m267fdcf5.gif)
вычитается значение
![](images/148245-nomer-32705219.gif)
. Если бы модель Раша была бы полностью адекватна результатам тестирования, и отсутствовали бы ошибки измерений, то указанные смещения привели бы к полному совпадению значений
![](images/148245-nomer-m409ebd84.gif)
, соответствующих одному и тому же значению первичного балла для любых вариантов теста, что является на практике маловероятным;
необходимо усреднить оценки подготовленности
![](images/148245-nomer-m409ebd84.gif)
, соответствующие одинаковому первичному баллу b по различным вариантам теста и подсчитать дисперсии значений
![](images/148245-nomer-m409ebd84.gif)
(
![](images/148245-nomer-m4f43b3a7.gif)
). Для одного (любого) варианта и дисперсию усредненного значения
![](images/148245-nomer-m386a946b.gif)
(
![](images/148245-nomer-m6cbf72a8.gif)
):
![](images/148245-nomer-5aa15052.gif)
, b=1, 2, 3, …… К-1,
![](images/148245-nomer-m53d4ecad.gif)
![](images/148245-nomer-m6c4b54a8.gif)
Однако необходимо убедиться, что максимальное уклонение
![](images/148245-nomer-m409ebd84.gif)
от
![](images/148245-nomer-m386a946b.gif)
не противоречит гипотезе о равенстве математических ожиданий
![](images/148245-nomer-2f9a2ee5.gif)
для любых параллельных вариантов теста.
Числа
![](images/148245-nomer-m386a946b.gif)
делят метрическую шкалу в логитах на К промежутков, каждому из которых можно приписать номер от 1 до К. Чтобы перенести на единую метрическую шкалу трудность
![](images/148245-nomer-96f67f2.gif)
j – задания (j=1, 2, 3, ….. К) в
![](images/148245-nomer-m2476bd8f.gif)
- варианте (
![](images/148245-nomer-ecea6de.gif)
), попадающую на промежуток с определенным номером, необходимо сделать линейную интерполяцию:
![](images/148245-nomer-m3247aee2.gif)
,
![](images/148245-nomer-m4de7346d.gif)
и
![](images/148245-nomer-m238a86c.gif)
- уклонения реально полученных оценок уровня подготовленности в
![](images/148245-nomer-m2476bd8f.gif)
варианте от усредненных значений,
![](images/148245-nomer-11e228d4.gif)
- исправленная трудность.
Недостатком данного подхода является то, что при линейной интерполяции копируется погрешность узловых значений уровней трудности заданий. Необходимо сглаживать эту погрешность, например можно аппроксимировать каждую функцию
![](images/148245-nomer-28244599.gif)
, заданную дискретно в (К-1) точках
![](images/148245-nomer-m386a946b.gif)
, кубическим сплайном
![](images/148245-nomer-m92f7c45.gif)
(с учетом точности характеристик исходных значений
![](images/148245-nomer-c4c9417.gif)
) [29]. Тогда исправленное значение латентного параметра уровня трудности задания можно представить следующим образом:
![](images/148245-nomer-m4fa3181b.gif)
.
Далее используя исправленные значения уровней подготовленности участников тестирования (
![](images/148245-nomer-m7cf34274.gif)
), приведенные к единой метрической шкале можно определить их окончательный балл.