Методика экспертизы программ основных и специальных курсов 6 Аналитическая справка 15

Вид материалаБюллетень

Содержание


Формулы для оценки заданий с несколькими правильными ответами
Формула (1)
Эталон ответа
Формула (2)
Формула (2')
Формула (3)
Формула (4)
Зарипов В.Н.
Подобный материал:
1   2   3   4   5   6   7   8   9   10

Формулы для оценки заданий с несколькими правильными ответами



При составлении теста чаще всего используются задания с выбором ответа. Если среди предлагаемых для выбора вариантов ответов правильным является только один, то оценивать задание очень легко: балл за выполнение такого задания равен 1, если задание выполнено верно, или 0, если задание выполнено неверно. В данной статье предлагаются формулы для оценки заданий с выбором правильного ответа в случае, когда таковых может быть несколько.

Пусть в задании с множественным выбором предлагается l вариантов для выбора, причем среди них имеется c правильных ответов. Пусть испытуемый при ответе сделал a правильных выборов и b неправильных. Как в этом случае выставить балл за выполнение этого задания?


Формула (1):

Очевидно, вес правильного ответа равен 1/c. Назначим для испытуемого, допустившего ошибки, "коэффициент наказания" (на который будем умножать вес ответа) в размере . Эта дробь представляет собой относительный вес правильных ответов в ответе испытуемого. Если испытуемый не допустил ни одной ошибки, то этот коэффициент равен единице и не меняет веса правильного ответа. В противном случае значимость правильного ответа снижается. Таким образом, окончательный вес правильного ответа равен . Умножая вес правильного ответа на количество правильных ответов, получаем формулу: .

Максимальный балл – единица – получается в случае, когда все выбранные варианты правильные (нет ни одного неправильного ответа). Минимальное значение, равное нулю, получается в случае, когда испытуемый не дал ни одного правильного ответа (при любом количестве неправильных ответов).

Эта формула обладает двумя недостатками. Первый заключается в проблеме нулевого знаменателя в случае, когда задание испытуемым пропущено (разумеется, в этом случае можно назначать ноль баллов, но это не будет результатом применения формулы). Второй недостаток – отсутствие дифференцирующего эффекта. Заметим, что ноль по этой формуле получается при отсутствии правильных ответов и любом количестве неправильных выборов. Тем самым одинаковый балл назначается испытуемому, пропустившему задание (возможно, ему просто не хватило времени), и всем испытуемым, не давшим верного ответа (хотя в каком-то смысле испытуемый, сделавший два неверных выбора, хуже испытуемого, допустившего лишь одну ошибку). Можно показать, что одинаковый балл возможен и в других ситуациях. Пусть, например, первый испытуемый дал a1 правильных ответов (но не все), а второй испытуемый дал a2 правильных (a2 > a1) и b неправильных ответов. Если делится нацело на a1, то балл у испытуемых будет одинаков при количестве ошибок . В примере, приведенном ниже, именно такая ситуация складывается для третьего и десятого испытуемого. Все это позволяет рекомендовать использование данной формулы при критериально-ориентированном подходе, но не в нормативно-ориентированном тесте.

Пример.

Пусть в задании с пятью вариантами для выбора три являются правильными. Рассмотрим все возможные варианты ответов испытуемых (см. табл. 1). В последнем столбце таблицы содержится результат расчетов по формуле (1). Ноль для четвертого испытуемого помечен звездочкой для того, чтобы подчеркнуть, что это результат договоренности, а не применения формулы.


Таблица 1

№ испыт

Эталон ответа

a

b

y

х

х

х







1

х

х

х







3

0

1

2

х

х










2

0

0,67

3

х













1

0

0,33

4
















0

0

0*

5

х

х

х




х

3

1

0,75

6

х

х







х

2

1

0,44

7

х










х

1

1

0,17

8













х

0

1

0

9

х

х

х

х

х

3

2

0,6

10

х

х




х

х

2

2

0,33

11

х







х

х

1

2

0,11

12










х

х

0

2

0


Во-первых, этот пример позволяет продемонстрировать отсутствие дифференциации испытуемых, не давших ни одного правильного ответа. Также заметим, что третий (один правильный ответ) и десятый (два правильных и два неправильных ответа) испытуемые получили одинаковый балл.

Во-вторых, покажем, что вклад правильного (так же, как и неправильного) ответа для различных испытуемых получается неодинаковым. Очевидно, для испытуемых, не допустивших ошибок, вес правильного ответа равен 1/3. Сравнивая ответ пятого и первого испытуемого, получаем, что разница в баллах составляет 0,25, а поскольку различие в ответах состоит только в одной ошибке пятого испытуемого, то один неправильный ответ пятого испытуемого понижает балл на 0,25 (вклад ошибки), и каждый правильный ответ тогда вносит в оценку 0,75:3=0,25. Сравнивая второго и шестого, получаем, что вклад ошибки для шестого равен 0,33, а вклад правильного ответа 0,055. Если же сравнивать пятого испытуемого с шестым, то получится вклад правильного ответа для пятого испытуемого равен 0,75-0,44=0,31. Таким образом, по формуле (1) мы можем соотнести балл испытуемого с абсолютным нулем или единицей, но не можем сравнить испытуемых друг с другом.


Формула (2):

Оценку за задание будем рассчитывать следующим образом: добавляем некоторую величину за каждый правильный ответ, вычитаем некоторую величину за каждый неправильный ответ и добавляем некоторую величину за "недопущенную ошибку". Обозначим вес правильного ответа wa, неправильного – wb, вес "недопущенной ошибки" – wn. Оценка испытуемого в этом случае будет равна

.

Для расчета весов используем следующие соображения. Если даны все правильные ответы и не допущено ни одной ошибки, ставим 1. Если даны все ответы (и правильные и неправильные), то за такой ответ ставим 0 (испытуемый это задание не решал). Если не дано ни одного ответа (ни правильного, ни неправильного), то это означает, что испытуемый пропустил задание; считаем, что это лучше, чем если бы он начал отвечать неправильно или угадывать правильный ответ. Поэтому за ответ "пусто" назначаем балл чуть выше (разницу – насколько выше – обозначим через t), чем за ответ, содержащий все правильные варианты, но с ошибкой.

Тогда имеем следующие соотношения:



Решаем эту систему, считая t свободным параметром. Тогда получаем:

.

Поскольку число правильных не равно общему количеству предложенных вариантов, то все формулы корректно определены.

Максимум (как было отмечено выше) равен fmax = 1. Минимум получается в ситуации, когда не дано ни одного правильного ответа, но выбраны все неправильные варианты.

Вообще говоря, величину t можно выбирать произвольно. Заметим, что если выбрать сразу t таким, чтобы fmin = 0, то ww= 0, что нарушает дифференцирующий эффект формулы. Поэтому рекомендуется выбирать . Например, величина t может равняться 1/l – то есть весу одного варианта ответа.

Для того, чтобы значения оценки изменялись от 0 до 1, необходимо преобразовать f  по формуле .


Формула (2'):

В формуле (2) поощрялись недопущенные ошибки. Можно поступить противоположным образом – "наказывать" за правильные ответы, которые не были выбраны испытуемым. Поскольку правильных ответов дано a, неправильных – b, и не дано (c – a) правильных ответов, то формула примет вид:

,

где w'n – вес правильного ответа, который не был дан. В этом случае рассуждения, аналогичные тем, которые были проведены для формулы (2), приводят к коэффициентам

.

Нетрудно убедиться, что при подстановке этих выражений в формулу (2') получается то же самое выражение, что при подстановке выражений wa, wb, wn в формулу (2) . То есть формулы эквивалентны, хотя и были интерпретированы различным образом.

Новый вид формулы удобен для рассуждений о количестве правильных вариантов среди предлагаемых. Если мы хотим, чтобы больший вклад в оценку вносили правильные ответы, то вес w'a по абсолютной величине должен быть больше веса w'b. Для этого должно выполняться lc, откуда получаем l/2, то есть количество правильных ответов должно быть меньше половины всех предлагаемых вариантов. Таким образом, чем больше дистракторов мы предлагаем, тем сильнее оценка зависит от количества правильных выборов и тем меньше влияние неправильных ответов на оценку.


Формула (3):

Если бонус за недопущенные ошибки не присваивать, то вес wn должен быть нулевым. В этом случае



Вид формулы при этом значительно упрощается:

.

Заметим, что максимальное и минимальное значения равны +1 и –1 соответственно, поэтому необходимо применить формулу для перевода значений в отрезок [0,1] (см. таблицу 2).


Формула (4):

Пусть максимальный балл равен 1 и может быть получен только в том случае, когда даны все правильные ответы и не сделано ни одной ошибки. Если же есть ошибки (b штук) или невыбранные правильные варианты (их количество равно c – a), то за каждый такой промах вычитается штраф в размере веса одного варианта. Поскольку предлагается l вариантов для выбора, то вес любого варианта считаем равным 1/l. Сумма штрафа в этом случае составит . Следовательно, балл за выполнение задания будет равен . Минимум в этом случае равен нулю и получается в случае, когда не дан ни один правильный ответ и выбраны все неправильные варианты (их количество – ).


Таблица 2

Сводка формул



Формула

Примечания




Проблема нулевого знаменателя, малый дифференцирующий эффект



, , fmax = 1,

,








,

Частный случай формулы (2)




Упрощенная модификация формулы (2)


Зарипов В.Н., зав. каф. физиологии человека и животных (1);

Щаницина С. В., ст. преп. кафедры вычислительной

и прикладной математики (2-4).