Выделяют пять общих требований к тестам контроля знаний: валидность; определенность (общепонятность)
Вид материала | Документы |
СодержаниеОценивание параметров функции успеха в модели Бирнбаума |
- Фролова Е. В., Санжаровская, 148.22kb.
- Общих требований к ответу «5», 129.55kb.
- Система контроля знаний в преподавании русского языка и литературы, 101.79kb.
- Различные формы и методы контроля знаний учащихся Различные формы и методы контроля, 114.33kb.
- Общие рекомендации к составлению тестов компоновка тестов > Требования к тестам, 451.26kb.
- Методика преподавания иностранных языков располагает значительным теоретическим багажом, 63.9kb.
- Государственный университет Высшая школа экономики, 45.29kb.
- Положение о балльно-рейтинговой системе контроля знаний студентов Общие положения, 84.83kb.
- Конспекты лекций Тесты для контроля качества знаний Слайд-презентации, 36.6kb.
- Для многоуровневого контроля знаний студентов, 37.36kb.
Оценивание параметров функции успеха в модели Бирнбаума
Пусть тест состоит из К различных заданий бинарного типа, (пытуемый получает 1, если ответил правильно и 0 при неверном ответе) и его выполняют N – студентов. В результате получается матрица ответов An,k состоящая из N- строк (i) и К – столбцов (j).
An,k=(aij)
Элементы матрицы ответов с вероятностью принимают значения равные 1 и с вероятностью значения равные 0:
,
где - дифференцирующая способность j- задания, - параметр трудности j- задания, - уровень подготовленности i – участника. Используя матрицу ответов необходимо выполнить оценку данных латентных параметров, например, используя метод наибольшего правдоподобия, основанный на том, что в качестве оценок параметров следует брать те значения, при которых функция правдоподобия принимает наибольшее из всех возможных значений [27]. В двухпараметрической модели Бирнбаума функция правдоподобия случайной дискретной величины балла aij будет функцией аргументов , и , являющейся плотностью совместного распределения наблюдаемых случайных величин и представляющей произведение вероятностей для всевозможных значений i и j:
В качестве точечных оценок латентных параметров , и принимают такие значения , и , при которых функция правдоподобия достигает глобального максимума, (такие оценки называют оценками наибольшего правдоподобия), т.е. для которых при любом допустимом наборе значений , и выполняется неравенство:
,
где , и определены с точностью до преобразования:
, , ,
где и некоторые произвольные постоянные.
Поэтому необходимо найти значения , и при которых будут выполняться следующие условия:
(среднее значение статистической оценки уровня подготовленности) и (несмещенная оценка дисперсии среднего значения уровня подготовленности).
Необходимо отметить, что функции и достигают максимума при одних и тех же значениях своих аргументов, поэтому более удобно искать максимум функции . В данном случае:
.
Для нахождения максимума функции необходимо решить систему уравнений:
, i=1, 2, 3, ……, N
, j=1, 2, 3, ……., К
, j=1, 2, 3, ……., К
Полученная система состоит из (N+2K) уравнений с N неизвестными значениями уровней подготовленности участников , К – неизвестными значениями уровней трудности заданий и К - неизвестными значениями дифференцирующей способности К заданий. При решении данной системы уравнений возникает ряд трудностей. Во-первых, уравнения входящие в данную систему являются нелинейными и их решение можно осуществить только численными методами. Во- вторых, при увеличении числа испытуемых число уравнений неограниченно возрастает, что не позволяет применить для решения данной системы широко известный метод Ньютона. Кроме того, в рамках двухпараметрической модели, первичные баллы не являются достаточными статистиками, поэтому испытуемые, получившие одинаковые первичные баллы в одном и том же варианте теста, могут получить различный окончательный балл.
Ситуация еще более усложняется, если в процессе тестирования использовались параллельные варианты теста. Для каждого из вариантов будет своя шкала оценок уровней подготовленности, уровней трудности заданий и их дифференцирующей способности. И сравнение оценок латентных параметров из разных вариантов, без предварительного сведения к единой шкале является некорректным.