Выделяют пять общих требований к тестам контроля знаний: валидность; определенность (общепонятность)

Вид материалаДокументы

Содержание


Метод моментов
Подобный материал:
1   2   3   4   5   6   7   8   9   10   11

Метод моментов



Для оценки параметров функции успеха (δ и θ) необходимо провести тестирование какого либо числа испытуемых N с помощью некоторого числа бинарных заданий К и построить матрицу ответов An,k состоящую из N- строк (i) и К –столбцов (j).


An,k=(aij)


Число bi равное сумме баллов в i- строке называется (как и раньше) первичным баллом i- испытуемого (оно равно числу его правильных ответов):


,


а число cj равное сумме баллов в k- столбце называется (как и раньше) первичным баллом j- задания (оно равно числу правильных ответов на это задание):





Необходимо найти:

- статистическую оценку , где i=1, 2, ……..n,

- статистическую оценку , где j=1, 2, ……..k.

И оценить точность и , т.е. найти и . Не вдаваясь в подробности [6-8], кратко рассмотрим, как найти , , и . Пусть участник с номером - i выполняет К заданий. Вероятность выполнения составляет Pi1-для первого задания, Pi2-для второго, Pi3 –для третьего, и т.д. до Pik. Случайные элементы (aij) матрицы ответов являются индикаторами успешного решения i – участником j- задания (aij принимают значения 1 или 0). Поэтому, математическое ожидание aij (М{aij}) просто равно вероятности Pij , а дисперсия aij (D{aij}) равна произведению Pij и qij (вероятность неправильного ответа i –участника на j- задание). Математическое ожидание M{bi} первичного балла i- испытуемого будет равно:


,

математическое ожидание M{cj} первичного балла j- задания будет равно:


.


Далее приравниваем математическое ожидание первичных баллов самим первичным баллам. Пирсон [7,8] доказал, что в этом случае получаются достаточно хорошие несмещенные оценки (их дисперсия при увеличении выборки стремится к 0). Таким образом, получаем следующую систему уравнений:




N-уравнений по числу участников, содержащих (N+K) неизвестных,



K-уравнений по числу заданий, содержащих (N+K) неизвестных.


В модели Раша [6,9,10] первичные баллы являются достаточными статистиками и

(N+K)

.


Пусть необходимо решить нелинейное уравнение вида:


f(x)=0,


где f(x) – заданная дважды дифференцируемая функция, и для искомого корня известно приближенное значение Х0 . Разложим функцию f(x) в окрестности точки Х0 в ряд Тейлора и ограничимся двумя первыми членами:


.


Далее находим, что:


,

а для итерационной процедуры:


, где n – номер последовательного итерационного приближения.


Производные левых частей уравнений:





имеют следующий вид:


, где


,


а для нахождения соответствующих итерационных приближений можно записать:


, где b=0, 1, 2, ……….K


, где j=1, 2, 3, ……K.


Здесь b- номер группы участников, набравших один и тот же первичный балл, Nb- количество участников в группе b, , , , - статистические оценки вероятностей, вычисляемые с использованием формулы:





по имеющимся приближенным значениям латентных параметров. В результате получим:


, ,


где Δ- малое положительное число (например: 0,005).





Для вычисления соответствующих приближений используют следующую схему [10,11]:

Полагают n=0 и вычисляют начальные приближения для каждого b:


, b=1, 2, 3, ……k-1


,


затем находят среднее значение





и центруют оценки , т.е. вычисляем уклонения:




Полагают m=0 и вычисляют начальные приближения для каждого j:


, j=1, 2, 3, ………K.

Очередное приближение вычисляют по формуле:


,


где


до тех пор пока не будет выполнено неравенство:


, для любого j=1, 2, 3, …….K, - имеющиеся к данному моменту центрированные оценки уровня подготовленности испытуемых, ε- малая положительная величина (ε<<∆).

Вычисляют очередное приближение по формуле:


,


где


до тех пор пока не будет выполнено неравенство:


, для любого b=1, 2, 3, …….K-1,


- имеющиеся к данному моменту оценки уровня трудности заданий. Затем находят среднее значение





и центруют оценки , т.е. вычисляют уклонения:


.


Затем вычисляют среднеквадратичное отклонение оценок очередного приближения от аналогичных оценок предыдущей итерации:


,


Если σ>ε/3, то переходят к пункту 3, если σ≤ε/3 то вычисления заканчивают.

Оценки уровня подготовленности участников тестирования и уровней трудности заданий характеризуют взаимное расположение латентных параметров на единой шкале логитов, но не их независимые значения (шкала не нормированная, а метрическая), нет информации определяющей начало отсчета. Замена =0 на =1 лишь смещает оценки по шкале на 1, не меняя их взаимного расположения.

Для выявления возможного сдвига оценок параметров тестирования необходимо, чтобы различные варианты теста имели общие задания или часть испытуемых выполнила все варианты. Предельным является случай, когда каждый испытуемый получает случайный набор заданий из общей базы, причем на всей выборке испытуемых будут использованы все задания базы, а число заданий в базе превосходит общее число задаваемых данному испытуемому вопросов. Эта проблема будет детально обсуждена в параграфе: Модель педагогического тестирования, при случайном выборе K заданий из множества M (модель “K из M”).