Выделяют пять общих требований к тестам контроля знаний: валидность; определенность (общепонятность)
Вид материала | Документы |
СодержаниеПреобразование метрической шкалы в нормированную Увеличение дифференциации результатов тестирования IRT - теория моделирования и параметризации педагогических тестов |
- Фролова Е. В., Санжаровская, 148.22kb.
- Общих требований к ответу «5», 129.55kb.
- Система контроля знаний в преподавании русского языка и литературы, 101.79kb.
- Различные формы и методы контроля знаний учащихся Различные формы и методы контроля, 114.33kb.
- Общие рекомендации к составлению тестов компоновка тестов > Требования к тестам, 451.26kb.
- Методика преподавания иностранных языков располагает значительным теоретическим багажом, 63.9kb.
- Государственный университет Высшая школа экономики, 45.29kb.
- Положение о балльно-рейтинговой системе контроля знаний студентов Общие положения, 84.83kb.
- Конспекты лекций Тесты для контроля качества знаний Слайд-презентации, 36.6kb.
- Для многоуровневого контроля знаний студентов, 37.36kb.
Преобразование метрической шкалы в нормированную
В ряде случаев задание нуля на единой метрической шкале производят на основе нормативной выборки испытуемых. Для этого используют следующую методику:
1) усредняют с учетом среднеквадратичных ошибок все значения уровней подготовленности испытуемых
![](images/148245-nomer-m7cf34274.gif)
![](images/148245-nomer-m37de2db6.gif)
2) рассчитывают соответствующую дисперсию уровня подготовленности участников из нормативной выборки относительно
![](images/148245-nomer-m37de2db6.gif)
3) смещают оценки всех латентных параметров на величину
![](images/148245-nomer-m37de2db6.gif)
![](images/148245-nomer-m73e68e21.gif)
![](images/148245-nomer-68791d39.gif)
Объем
![](images/148245-nomer-m2ac5ec8d.gif)
![](images/148245-nomer-m37de2db6.gif)
![](images/148245-nomer-11e228d4.gif)
![](images/148245-nomer-62cf3524.gif)
![](images/148245-nomer-m2e8e196c.gif)
Увеличение дифференциации результатов тестирования
При работе с достаточно большими выборками испытуемых проблема дифференциации результатов тестирования становится невероятно острой. Поскольку статистические оценки уровней подготовленности всех участников, набравших одинаковые первичные баллы, будут совпадать, т.к. являются равными функциями равных достаточных статистик (по крайней мере, в рамках модели Раша). Например, если в тесте 40 заданий, то вне зависимости от общего количества участников и вне зависимости от используемой шкалы количество различных значений окончательного балла не может превышать 40. Для повышения степени дифференциации можно учитывать еще и уровень трудности заданий, и коэффициенты дискриминации (разрешающей способности) заданий [6]. Одним из путей решения этой проблемы является дополнительное использование и окончательных баллов
![](images/148245-nomer-m327fb857.gif)
![](images/148245-nomer-m4e26132c.gif)
![](images/148245-nomer-m7a8fb34c.gif)
![](images/148245-nomer-m7a8fb34c.gif)
![](images/148245-nomer-m4e26132c.gif)
![](images/148245-nomer-16f7e6c5.gif)
Распределение по целым числам из указанного промежутка необходимо выполнить в соответствии с распределением реально полученных значений
![](images/148245-nomer-222ecb08.gif)
![](images/148245-nomer-m45693acd.gif)
![](images/148245-nomer-m2e9b9178.gif)
![](images/148245-nomer-m75187dc.gif)
![](images/148245-nomer-222ecb08.gif)
![](images/148245-nomer-m75187dc.gif)
![](images/148245-nomer-222ecb08.gif)
![](images/148245-nomer-m45693acd.gif)
![](images/148245-nomer-m2e9b9178.gif)
![](images/148245-nomer-m75187dc.gif)
![](images/148245-nomer-6a20bf29.gif)
являющуюся частичной суммой ряда Грамма - Шарлье для плотности нормального закона распределения, где
![](images/148245-nomer-m7fb354b1.gif)
![](images/148245-nomer-m488c1221.gif)
![](images/148245-nomer-m57b2422f.gif)
![](images/148245-nomer-m556492b3.gif)
![](images/148245-nomer-m5f208dff.gif)
![](images/148245-nomer-m5753ea32.gif)
![](images/148245-nomer-m7f7bd3fa.gif)
![](images/148245-nomer-m53664606.gif)
![](images/148245-nomer-10fb70b9.gif)
![](images/148245-nomer-45a600e7.gif)
Список состоящий из
![](images/148245-nomer-m7a8fb34c.gif)
![](images/148245-nomer-m5c98f9a1.gif)
![](images/148245-nomer-c4ec9fa.gif)
![](images/148245-nomer-m5c98f9a1.gif)
![](images/148245-nomer-1f9a65c1.gif)
![](images/148245-nomer-16f7e6c5.gif)
![](images/148245-nomer-c4ec9fa.gif)
![](images/148245-nomer-1f9a65c1.gif)
![](images/148245-nomer-m6b35b49e.gif)
![](images/148245-nomer-128dedd1.gif)
![](images/148245-nomer-m4c485c54.gif)
![](images/148245-nomer-1644f69e.gif)
![](images/148245-nomer-m4c485c54.gif)
![](images/148245-nomer-1f9a65c1.gif)
![](images/148245-nomer-1f9a65c1.gif)
![](images/148245-nomer-m4c485c54.gif)
![](images/148245-nomer-7978794f.gif)
![](images/148245-nomer-2a29b469.gif)
![](images/148245-nomer-c4ec9fa.gif)
![](images/148245-nomer-61b3f7cc.gif)
![](images/148245-nomer-m256d5f45.gif)
![](images/148245-nomer-7978794f.gif)
![](images/148245-nomer-2a29b469.gif)
Первая группа участников тестирования будет состоять из
![](images/148245-nomer-32a8a6.gif)
![](images/148245-nomer-2bd80c71.gif)
![](images/148245-nomer-16f7e6c5.gif)
![](images/148245-nomer-6b4ec505.gif)
![](images/148245-nomer-52c23e48.gif)
![](images/148245-nomer-2a29b469.gif)
В заключении следует отметить, что наибольшие изменения будут претерпевать баллы, находящиеся в средней части метрической шкалы, а высокие и низкие значения баллов будут изменяться незначительно.
IRT - теория моделирования и параметризации педагогических тестов
Другой наиболее широко используемой моделью диагностики знаний в настоящее время является двухпараметрическая модель Бирнбаума [30,31], относящаяся к теории моделирования и параметризации педагогических тестов или сокращенно ТМППТ. В англоязычной литературе данная теория носит название Item Response Theory (IRT). Принципиальное отличие Item Response Theory от теории Раша заключается в том, что в данном случае каждое тестовое задание рассматривается, как самостоятельная структурная единица, параметры которой не зависят от параметров других заданий.
В основе всех моделей Item Response Theory лежат так называемые функции успеха, имеющие заранее известный вид и определяющие зависимость верного решения задания от уровня подготовленности испытуемого. Для оценки параметров моделей Item Response Theory используют специальные итерационные методы, что является достаточно сложной задачей, однако эти модели имеют по сравнению с моделью Раша ряд преимуществ. В частности, для нанесения результатов на единую шкалу по различным вариантам теста нет необходимости вводить предположения об их параллельности. Более того, можно свести воедино результаты, полученные при использовании разных по трудности тестов. Модели Item Response Theory менее чувствительны к длине теста и уровню трудности заданий. Следует отметить, что дисперсия ошибки измерения уровня подготовленности в модели Раша несколько больше, чем в Item Response Theory.
Одной из основных и наиболее применимых моделей Item Response Theory является так называемая двухпараметрическая модель Бирнбаума. Сущность этой теории заключается в следующем [27,28]. Пусть параметр
![](images/148245-nomer-6a6b06fd.gif)
![](images/148245-nomer-2ea2aaa9.gif)
![](images/148245-nomer-328b8e5c.gif)
![](images/148245-nomer-6a6b06fd.gif)
![](images/148245-nomer-2ea2aaa9.gif)
![](images/148245-nomer-328b8e5c.gif)
![](images/148245-nomer-m325d774a.gif)
![](images/148245-nomer-m40e76720.gif)
Данное выражение показывает, что вероятность успеха
![](images/148245-nomer-m325d774a.gif)
![](images/148245-nomer-328b8e5c.gif)
![](images/148245-nomer-4e79d5fe.gif)
![](images/148245-nomer-m325d774a.gif)
![](images/148245-nomer-6a6b06fd.gif)
![](images/148245-nomer-3ef1064.gif)
![](images/148245-nomer-m70cda734.gif)
![](images/148245-nomer-4157135f.gif)
![](images/148245-nomer-41921d23.gif)
![](images/148245-nomer-m19dc14b0.gif)
![](images/148245-nomer-62dfc7c0.gif)
т.е. с уменьшением уровня подготовленности участника вероятность верного решения задания уменьшается до 0, а при увеличении уровня подготовленности увеличивается до 1.
![](images/148245-nomer-22028de4.png)
Рис.3. Характеристическая кривая задания с уровнем трудности
![](images/148245-nomer-m6906a7fd.gif)
![](images/148245-nomer-48d5a26c.gif)
При увеличении параметра
![](images/148245-nomer-m6f319a65.gif)
![](images/148245-nomer-m7318be92.gif)
![](images/148245-nomer-m30fba36d.gif)
![](images/148245-nomer-654a11ba.gif)
![](images/148245-nomer-m7318be92.gif)
![](images/148245-nomer-328b8e5c.gif)
![](images/148245-nomer-36a3f093.gif)
![](images/148245-nomer-m59d80138.gif)
![](images/148245-nomer-m64aa9813.gif)
![](images/148245-nomer-m59d80138.gif)
![](images/148245-nomer-m64aa9813.gif)
![](images/148245-nomer-36a3f093.gif)
![](images/148245-nomer-m6e15e958.gif)
![](images/148245-nomer-m59d80138.gif)
![](images/148245-nomer-3019bfd0.gif)
![](images/148245-nomer-23d7e776.gif)
![](images/148245-nomer-540f9449.gif)
![](images/148245-nomer-m5ff9971.gif)
![](images/148245-nomer-m64aa9813.gif)
![](images/148245-nomer-3019bfd0.gif)
![](images/148245-nomer-23d7e776.gif)
![](images/148245-nomer-540f9449.gif)
![](images/148245-nomer-m5ff9971.gif)
![](images/148245-nomer-108c8958.png)
Рис.4. Характеристические кривые задания с одинаковым уровнем трудности
![](images/148245-nomer-36a3f093.gif)
![](images/148245-nomer-328b8e5c.gif)