Особенности статистической оценки качества теста диагностики индивидуального прогресса учащихся общеобразовательной школы
Дипломная работа - Педагогика
Другие дипломы по предмету Педагогика
ся как частное суммы всех тестовых баллов и количества испытуемых в группе.
,
где - количество испытуемых. В рассматриваемом примере ;
3.Достижение -го испытуемого . Находится как частное количества правильно выполненных заданий и общего числа заданий.
,
где - количество правильно выполненных заданий, - общее число заданий.
.Среднее достижение группы - частное от суммы всех достижений группы на общее число испытуемых.
,
в нашем примере .
5.Отклонение достижения каждого учащегося от достижения группы - разность среднего достижения группы и достижения -го испытуемого.
Также первичные показатели характеризуют достижения испытуемых, на основании которых делаются выводы об уровне усвоения материала и качестве его усвоения на этом уровне.
Далее рассмотрим вторичные показатели:
1.Среднее отклонение достижений испытуемых . Вычисляется по формуле
,
в нашем примере .
Таблица 1. Вычисление первичных и вторичных показателей.
Испы- туемыеЗаданияОбщий тестовый балл ХДостижение Отклонение123456789101110100011050,50,062110001000140,40,163010101001150,50,064111001111180,80,245000111000140,40,166111100101170,70,147111000101160,60,048111111001180,80,249100010101040,40,1610001010101150,50,0611100011110050,50,0612111110010060,60,04Промежуточные вычисленияРаiет первичных показателей Раiет вторичных показателей
2.Сумма квадратов отклонений от средней арифметической оценки . Вычисляется по формуле
,
для рассматриваемого примера .
3.Дисперсия тестовых результатов . Вычисляется по формуле
,
для нашего примера .
4.Стандартное отклонение по тесту . Находится как корень из дисперсии
.
В нашем случае
5.Коэффициент корреляции . Существует несколько формул для вычисления коэффициента корреляции, и все они используются в разных статистических методах оценки качества педагогического теста. Мы будем рассматривать эти формулы в процессе анализа методов.
.Коэффициент надежности . Аналогично, как и с коэффициентом корреляции, в каждом методе используют разные формулы для вычисления коэффициента надежности. Рассмотрим их в процессе анализа методов.
Раiет перечисленных показателей также составляет основу методики количественной оценки качества педагогического теста. Как уже отмечалось раньше, с их помощью оцениваются валидность, надежность и дифференцирующая способность, которые являются основными характеристиками качества педагогического теста.
Мы рассмотрели 11 статистических показателей (5 первичных и 6 вторичных), которые используются в классической теории тестирования. Эти показатели мы будем использовать при анализе методов оценки качества педагогического теста. В следующем параграфе мы рассмотрим методы оценки основных характеристик (валидность, надежность, дифференцирующая способность) качества педагогического теста, учитывая рассмотренные выше первичные и вторичные показатели.
2.2 МЕТОДЫ СТАТИСТИЧЕСКОЙ ОЦЕНКИ КАЧЕСТВА ТЕСТА
Методы оценки основных характеристик теста состоят из двух частей:
A.Вычисление некоторой величины или характеристики;
B.Интерпретация полученного результата, в соответствии с нормой. Норма определяется согласно специфике теста.
Как правило, прежде чем применять методы статистической обработки к тестовым заданиям, сначала используют описательную статистику, которая заключается в вычислении статистических показателей. Рассмотрим их.
Первый из них - среднее отклонение достижений испытуемых. Далее расiитываем три взаимосвязанных показателя:
. - сумма квадратов отклонений от средней арифметической оценки.
. - дисперсия.
. - стандартное отклонение по тесту.
По величине можно судить о доверительном интервале достижений испытуемых. В окрестности находится большинство достижений группы. Дисперсия тестовых результатов показывает интервал (меру разброса), в котором находятся все полученные баллы испытуемых, включая стандартное отклонение по тесту и ошибку измерения. По величине стандартного отклонения можно судить о статистическом характере распределения результатов [21]. Если средний тестовый балл равен , а , то в интервале находятся баллы, набранные большинством тестируемых.
Рассмотрим некоторые классические методы оценки основных характеристик теста (валидность, надежность, дискриминативность).
2.2.1 Методы оценки валидности
Напомним, что валидность в теории тестирования означает соответствие формы и содержания теста тому, что он должен оценивать или измерять по замыслу его создателей [21]. Из анализа литературы [4,14,17,20,21] мы выделили два метода оценки валидности. Рассмотрим их.
Метод 1. Вычисляется коэффициент корреляции каждого тестового задания с суммой индивидуальных тестовых баллов испытуемых, который показывает, насколько Валино данное задание отличает слабых от сильных.
А. Коэффициент корреляции расiитывается по формуле [14]:
,
где - средний арифметический балл испытуемых, успешно выполнивших -е задание теста, - средний арифметический балл испытуемых, не справившихся с -м заданием, - стандартное отклонение по -му заданию, - стандартное отклонение по всему тесту.
В. Значение коэффициента корреляции интерпретируется следующим образом:
0,7 - 1 - связь очень сильная;
0,5 - 0,7 - средняя;
0,3 - 0,5 - слабая.
Метод 2. Также как и в предыдущем