Выделяют пять общих требований к тестам контроля знаний: валидность; определенность (общепонятность)
| Вид материала | Документы |
СодержаниеОценивание параметров функции успеха в модели Бирнбаума |
- Фролова Е. В., Санжаровская, 148.22kb.
- Общих требований к ответу «5», 129.55kb.
- Система контроля знаний в преподавании русского языка и литературы, 101.79kb.
- Различные формы и методы контроля знаний учащихся Различные формы и методы контроля, 114.33kb.
- Общие рекомендации к составлению тестов компоновка тестов > Требования к тестам, 451.26kb.
- Методика преподавания иностранных языков располагает значительным теоретическим багажом, 63.9kb.
- Государственный университет Высшая школа экономики, 45.29kb.
- Положение о балльно-рейтинговой системе контроля знаний студентов Общие положения, 84.83kb.
- Конспекты лекций Тесты для контроля качества знаний Слайд-презентации, 36.6kb.
- Для многоуровневого контроля знаний студентов, 37.36kb.
Оценивание параметров функции успеха в модели Бирнбаума
Пусть тест состоит из К различных заданий бинарного типа, (пытуемый получает 1, если ответил правильно и 0 при неверном ответе) и его выполняют N – студентов. В результате получается матрица ответов An,k состоящая из N- строк (i) и К – столбцов (j).
An,k=(aij)
Элементы матрицы ответов с вероятностью
принимают значения равные 1 и с вероятностью
значения равные 0:
,где
- дифференцирующая способность j- задания,
- параметр трудности j- задания,
- уровень подготовленности i – участника. Используя матрицу ответов необходимо выполнить оценку данных латентных параметров, например, используя метод наибольшего правдоподобия, основанный на том, что в качестве оценок параметров следует брать те значения, при которых функция правдоподобия принимает наибольшее из всех возможных значений [27]. В двухпараметрической модели Бирнбаума функция правдоподобия
случайной дискретной величины балла aij будет функцией аргументов
,
и
, являющейся плотностью совместного распределения наблюдаемых случайных величин и представляющей произведение вероятностей
для всевозможных значений i и j:
В качестве точечных оценок латентных параметров
,
и
принимают такие значения
,
и
, при которых функция правдоподобия
достигает глобального максимума, (такие оценки называют оценками наибольшего правдоподобия), т.е. для которых при любом допустимом наборе значений
,
и
выполняется неравенство:
,где
,
и
определены с точностью до преобразования:
,
,
,где
и
некоторые произвольные постоянные.Поэтому необходимо найти значения
,
и
при которых будут выполняться следующие условия:
(среднее значение статистической оценки уровня подготовленности) и
(несмещенная оценка дисперсии среднего значения уровня подготовленности).Необходимо отметить, что функции
и
достигают максимума при одних и тех же значениях своих аргументов, поэтому более удобно искать максимум функции
. В данном случае:
. Для нахождения максимума функции
необходимо решить систему уравнений:
, i=1, 2, 3, ……, N
, j=1, 2, 3, ……., К
, j=1, 2, 3, ……., КПолученная система состоит из (N+2K) уравнений с N неизвестными значениями уровней подготовленности участников
, К – неизвестными значениями уровней трудности
заданий и К - неизвестными значениями дифференцирующей
способности К заданий. При решении данной системы уравнений возникает ряд трудностей. Во-первых, уравнения входящие в данную систему являются нелинейными и их решение можно осуществить только численными методами. Во- вторых, при увеличении числа испытуемых число уравнений неограниченно возрастает, что не позволяет применить для решения данной системы широко известный метод Ньютона. Кроме того, в рамках двухпараметрической модели, первичные баллы не являются достаточными статистиками, поэтому испытуемые, получившие одинаковые первичные баллы в одном и том же варианте теста, могут получить различный окончательный балл.Ситуация еще более усложняется, если в процессе тестирования использовались параллельные варианты теста. Для каждого из вариантов будет своя шкала оценок уровней подготовленности, уровней трудности заданий и их дифференцирующей способности. И сравнение оценок латентных параметров из разных вариантов, без предварительного сведения к единой шкале является некорректным.
