В. П. Левин, кандидат физико-математических наук
Вид материала | Документы |
СодержаниеДвухшаговое адаптивное тестирование |
- А. Б. кандидат физико-математических наук, доцент Трифонов А. Ю. Дата Лекция, 38.71kb.
- Дмитрия Игоревича Шпаро, математика, кандидата физико-математических наук. Творческая, 372.62kb.
- Практических: 34 Лабораторных, 15.9kb.
- Березинец Ирина Владимировна, кандидат физико-математических наук, доцент, berezinets@gsom, 169.64kb.
- Березинец Ирина Владимировна, кандидат физико-математических наук, доцент, berezinets@gsom, 103.21kb.
- Программа для поступающих в магистратуру по специальности 1-25 80 08 «Математические, 100.45kb.
- Лабораторных: 17 0, 18.73kb.
- Б. В. Евтеев кандидат физико математических наук наук, доцент, 666.97kb.
- Избранные главы, 3027.15kb.
- Практических: 34 Лабораторных:, 17.77kb.
В.П. ЛЕВИН, кандидат физико-математических наук
Института металлургии и металловедения им. А. А. Байкова;
В.В. ЗИНОВЬЕВ, зам. генерального директора учебно-производственной фирмы "Дейл"
МЕТОДИКА КОНСТРУИРОВАНИЯ ПЕДАГОГИЧЕСКИХ ТЕСТОВ
АДАПТИВНОЕ ТЕСТИРОВАНИЕ
Для повышения качества образования, степени индивидуализации обучения необходимо увеличение масштабов тестирования в учебном процессе. Классическая теория тестирования обладает многочисленными недостатками. Одним из недостатков является неустойчивость в определении трудности заданий вследствие некоторой неопределенности в оценке дифференцирующей способности заданий и качества подготовки тестируемой выборки. Фиксированная длина традиционного теста (ТТ) не учитывает индивидуальные способности учащихся. Это приводило к невозможности эффективного оценивания различной подготовленности одним и тем же тестом. К другим недостаткам ТТ относятся: значительные материальные и временные затраты на составление теста, недостаточная 'точность в оценке знаний учащихся, наличие неработающих очень легких или наоборот трудных заданий для тестируемого учащегося. Эти несовершенства ТТ создают противоречия между контрольно-оценочной деятельностью педагогов и низкой эффективностью традиционного тестирования.
Для оценки результатов тестирования вводится понятие среднего учащегося на основании предположения, что среднеподготовленных учащихся больше и результаты тестирования подчиняются нормальному распределению. Такой подход снижает точность оценок наиболее слабых и наиболее сильных учащихся. Кроме того, в этом случае возникают проблемы, связанные с определением единой точки отсчета при выборе шкалы измерения результатов выполнения комплекта вариантов теста.
Традиционные тесты не дают прогностической информации, так как имеют ограниченные возможности при сравнении результатов испытуемых вследствие существенной зависимости оценки испытуемых от количества и трудности заданий. Прогностическая информация, позволяющая предсказать вероятность успеха испытуемых определенного уровня подготовленности при выполнении различных заданий теста, необходима при конструировании тестов, когда ставится задача генерации эффективных тестов. Корректное сравнение возможно только при наличии комплектов параллельных тестов, что требует больших временных и материальных затрат при подготовке тестов и на практике реализуется редко.
К перечисленным недостаткам можно добавить еще и то, что классическая теория тестирования не обеспечивает приемлемого решения ряда проблем, связанных с вопросами моделирования тестов, выбором малых заданий процессе генерации адаптивных тестов и выравнивания результатов их выполнения с целью переноса оценок испытуемых на единую интервальную шкалу.
В рамках традиционного тестирования недостатки классической теории частично преодолеваются путем введения норм - системы показателей, установленных эмпирически сообразно результатам тестирования репрезентативной выборки тестируемых. Процесс установления норм называют стандартизацией теста. При этом тест понимается как устойчивая система заданий, неоднократно применявшаяся для всех испытуемых. В связи с этим становится актуальной проблема повышения эффективности системы традиционного тестирования и традиционных тестов, и одно из направлений в решении этой проблемы — адаптация системы тестирования к индивидуальным особенностям учащихся.
Рассмотренные недостатки классической теории, ее ограниченные возможности в решении ряда практических проблем послужили предпосылкой к созданию методологии новой теории тестов— Item Response Theory (IRT). Преимущества IRT по сравнению с традиционной теорией обусловлены соответствующим научным подходом, для которого характерно стремление к строгому формальному представлению и анализу эмпирических данных. В IRT высказываются строгое предположения о характере оцениваемых параметров и процессах, протекающих при выполнении испытуемыми заданий.
Первоначально в IRT вводится основное предположение о существовании некоторой функциональной связи между наблюдаемыми результатами тестирования и латентными (скрытыми) параметрами испытуемых, выполняющих тест. Эти параметры трактуются как способности испытуемых или как уровни подготовки по предмету в зависимости от целей измерения, которые выдвигаются при создании педагогического теста. Наблюдаемые результаты связывают с вероятностью правильного выполнения задания группой испытуемых либо с вероятностью правильного выполнения испытуемым различных по трудности заданий теста.
Существенное отличие IRT от классической теории тестов заключается в том, что индивидуальный балл тестируемого в классической теории тестов рассматривается как постоянное число, а латентный параметр в IRT — как некоторая переменная. Переменный характер измеряемой величины позволяет получить ее значение с заданной точностью путем последовательных приближений. В гомогенных тестах латентный параметр один, а в гетерогенных тестах имеется набор латентных параметров. В IRT вводится предположение об одномерности латентной переменной для данного гомогенного набора заданий теста. На практике это предположение не выполняется, так как на результаты выполнения заданий испытуемым влияет множество фактов, поэтому под одномерностью латентного параметра понимается наличие одного доминирующего фактора. В основе IRT лежат три предположения:
- под латентным параметром в IRT понимается уровень подготовленности по предмету , тогда группе испытуемых соотносится множество i Значение латентного параметра образует равные трудности заданий теста i;
- ответы на вопросы теста предполагаются независимыми друг от друга;
- вводится предположение о нормальном характере распределения значений латентных параметров и .
В рамках IRT необходимо ответить на два вопроса — установить связь между и и выбрать вид функциональной зависимости для описания связи между латентными параметрами и наблюдаемыми результатами выполнения теста. Удачную форму связи между и нашел G. Rasch в виде разности 1. Применение этой разности позволяет ввести единую шкалу интервального типа и единицу ее измерения — легат. Это дает возможность корректно сравнить результаты испытуемых, полученные с помощью различных тестов, подобрел» оптимальные значения трудности заданий и минимизировать ошибки измерений. На основе оценивания разности возникает возможность индивидуализации процессов контроля и обучения путем подбора оптимальных по трудности заданий для; каждого учащегося.
Центральным вопросом в IRT является выбор математической модели, описывающей взаимосвязь между эмпирическими результатами тестирования и значениями латентных параметров и . Эта модель и конкретный вид соответствующей функции базируются на существование вероятностной связи между эмпирическими результатами тестирования и значениями и . Существенным достоинством IRT является введение информационной функции, которая используется для оценки эффективности теста. Это позволяет ввести дифференцированную оценку эффективности задания теста для оценки уровня подготовки испытуемого .
Переход от традиционной классической теории тестов к IRT в практическом плане неизбежно связан с некоторыми трудностями:
- с необходимостью привлечения довольно сложного математического аппарата;
- с использованием дорогостоящей компьютерной техники и разработки специальных программных продуктов;
- с необходимостью проведения тщательной работы по стратификации выборки испытуемых статистик с математическими моделями измерения.
Достоинством IRT являются:
- устойчивая и объективированная оценка параметров уровня знаний и трудности задания, их относительная инвариантность от конкретного опыта;
- наличие единой шкалы для соотнесения параметров трудности заданий и подготовленности испытуемых;
- возможность подсчета дифференцированной ошибки измерения способностей испытуемых, что позволяет организовать процесс адаптивного обучения как последовательное приближение к наиболее точным оценкам способностей учащихся;
- возможность компьютеризации расчетов всех тестовых баллов.
Повышение уровня эффективности тестов возможно при переходе от традиционных тестов фиксированной длины к адаптивному тестированию. Идея адаптивного обучения заключается в соотнесении оценок параметров испытуемых и трудности заданий путем введения аналитической зависимости между уровнем подготовленности обучающихся и трудностью заданий для каждого учащегося. Другой особенностью адаптивного тестирования является минимизация числа заданий. Эффективность тестирования повышается при адаптации тестов по трудности к уровню знаний учащегося. Методология адаптивного тестирования строится на основе современной теории конструирования тестов IRT и использования компьютерных технологий. Особенностью адаптивного тестирования является тесное переплетение контролирующей и обучающей функций в индивидуализированном режиме, поэтому в качестве перспективного направления развития контрольно-оценочных систем следует выделить внедрение методов адаптивного тестирования и активизацию обучающей функции контроля путем перехода к контрольно-обучающим программам с индивидуализированными траекториями обучения. В адаптивном обучении развитие; обучающихся становится доминирующим фактором благодаря дифференцированному подходу к учащимся и индивидуализации обучения.
Одним из существующих путей создания адаптивных тесто» является разделение учащихся на отдельные полгруппы и подбор соответствующих заданий. Другой путь заключается в повышении индивидуализации взаимодействия преподавателя с тестируемым при проведении тестирования. В этом случае число заданий снижается за счет увеличения труда проводящих тестирование педагогов.
Рассмотрим цели, задачи и функции адаптивного тестирования, а также технологии применения адаптивного теста (AT) в современном учебном процессе. В качестве специфических целей адаптивного тестирования следует выделить следующие направления:2
- ориентация в учебном процессе на адаптивны* методы обучения и контроля;
- организация на самостоятельную работу учащихся с помощью адаптивных контрольно-обучающих программ;
- решение образовательных проблем через дифференциацию и индивидуализацию обучения;
- использование методов адаптивного тестирования как основы для реализации методик развивающего и продуктивного обучения.
Использование методики адаптивного тестирования в учебном процессе позволяет существенно ускорить и повысил» качество выполнения учебных заданий, оптимизировать реализацию традиционных педагогических функций. Основными функциями адаптивного тестирования являются как традиционные, характерные при любой методике обучения, так и специфические, присущие только AT: диагностическая, оценочная, обучающая, корректирующая, развивающая, прогностическая. Специфические функции AT открывают новые возможности для осуществления оперативной и эффективной коррекции в обучении, самоконтроля в режиме самоадаптации при выборе заданий адаптивных тестов. Диагностическая и корректирующая функции, составляющие сущность адаптивного тестирования, выявляют пробелы в знаниях, устанавливают причины этих пробелов и позволяют организовать коррекцию учебного процесса. Компьютерные технологии дают возможность наиболее эффективно выполнять эти функции. Использование программно-инструментальных средств для генерации и выдачи адаптивных тестов позволяет осуществить функцию текущего контроля непосредственно в ходе учебной деятельности.
Наиболее эффективный метод осуществления оценочной процедуры в процессе аттестации основан на адаптивных тестах. В зависимости от потребностей аттестационного процесса оценочная функция адаптивного тестирования может приобретать различные оттенки, влияющие на интерпретацию тестовой оценки испытуемого. В одном случае оценка ориентирована на характеристику степени освоения требований стандартов, тогда по результатам адаптивного тестирования группа испытуемых делится на две подгруппы: аттестованных и не аттестованных выпускников3. В другом случае, когда есть необходимость выставления баллов аттестованным выпускникам для их ранжирования, оценка выполняет роль дифференцирующего фактора, распределяющего испытуемых на оси переменно измерения по результатам выполнения адаптивных тестов.
Оценочная функция адаптивного тестирования связана с подведением итогов обучения путем оценки его результатов в конце определенного периода учебного процесса. Эффективное выполнение оценочной функции было невозможным до появления IRT и построения на ее основе процессов генерации и оценки результатов выполнения адаптивных тестов.
Технология адаптивного тестирования представляет собой системную совокупность методов создания и функционирования AT, адаптивных стратегий, алгоритмов, специальных программно-инструментальных средств, предназначенных для оптимизации и повышения эффективности процессов обучения и контроля знаний. В технологии адаптивного тестирования следует выделить следующие направления:4
- разработка и создание теоретико-методологического обоснования тестирования, Методов, алгоритмов и средств технологии AT;
- разработка адаптивного тестирования как метода обучения и контроля, являющегося частью общей дидактической системы обучения, снижающего долю преподавательского труда, что позволяет преподавателю перераспределить учебное время и оптимизировать учебный процесс;
- разработка на базе AT методологии развивающего, продуктивного обучения и других педагогических инноваций;
- разработка методик, направленных на увеличение доли самостоятельного обучения в образовательном процессе;
- адаптивное тестирование как методика для организации процесса самообразования;
- разработка программно-инструментальных средств, обеспечивающих функционирование адаптивного тестирования.
В построении адаптивного тестирования различают двухшаговое и многошаговое тестирование. Двухшаговое адаптивное тестирование предполагает наличие двух этапов, отличающихся по целям, задачам и видам используемых тестов. На первом этапе учащиеся выполняют входной ТТ. Цель первого этапа — осуществить дифференциацию испытуемых, по результатам которой определяется интервал, в котором строятся адаптивные тесты с позиции IRT. Для осуществления двухшагового адаптивного тестирования необходимо решить следующие задачи:
- создание входных тестов для начальной дифференциации и выделения интервалов тестирования по измеряемой шкале для составления AT;
- выделение результатов отдельных испытуемых в соответствующих интервалах измеряемой шкалы;
- организация процесса моделирования тестов путем генерации AT в выбранных интервалах шкалы;
- интерпретация полученных результатов AT.
Обеспечение требуемой точности измерений на втором шаге достигается путем моделирования адаптивных тестов, ориентированных на оценки испытуемых, полученные на первом тестировании. Генерация адаптивного теста состоит из ряда этапов:
- оценка пределов измерений по результатам первого тестирования;
- выбор планируемой точности измерения по стандартной ошибке измерения;
- задание формы целевой информационной функции теста, которая строится на выделенном интервале измерений;
- выбор планируемого вида распределения оценок трудности заданий теста, например прямоугольное, когда все оценки параметра трудности распределены равномерно;
- отбор заданий, информационные функции которых наиболее приемлемым образом заполняют область под целевой информационной функцией;
- добавление заданий на основе вычисления количества информации.
Отбор заданий из банка продолжается до тех пор, пока очередная информационная функция теста не аппроксимирует в приемлемой степени в целевую информационную функцию.
Метод моделирования помогает отобрать задания с оптимальными параметрами для организации адаптивного тестирования. В качестве параметров заданий выбирают обычно два — трудность задания и дифференцирующую способность задания. Метод моделирования для генерации AT должен основываться на IRT и на современных компьютерных технологиях, позволяющих существенно сократить временные затраты на достижение сопоставимого результата. Это дает возможность ввести в широкую педагогическую практику многошаговое адаптивное тестирование. Алгоритм многошагового адаптивного тестирования строится на полной контекстной зависимости, в которой очередной шаг в выполнении тестовых заданий совершается только после оценки предыдущего шага, после чего принимается оперативное решение о подборе трудности следующего задания. Для каждого учащегося в этом случае возможно построение индивидуальной траектории обучения, задания которой строятся на основе обратной связи между результатом выполнения задания и последующим тестовым заданием. В случае неверного ответа испытуемому предъявляется более легкое задание. Эффективная пошаговая генерация тестовых заданий возможна только с использованием современных компьютерных технологий. Генерация AT на основе классической теории тестов носит ограниченный характер. Это связано с тем, что отсутствие дифференцированной ошибки измерения в классической теории тестов не позволяет планировать точность оценок результатов испытуемых и задействовать эффективный научный аппарат информационных функций IRT в процессе конструирования адаптивного теста.
Современное перспективное развитие адаптивного тестирования связано с IRT, где тест моделируется заданной информационной функцией и вводится дифференцированная ошибка измерения. Это дает возможность в рамках адаптивного тестирования наряду с минимизацией заданий и времени тестирования обеспечить одинаковую для всей группы точность измерения.
В целом применение адаптивного тестирования позволяет:
- совершенствовать объективные процедуры и технологии, обеспечивающие контрольно-оценочную деятельность педагогов;
- повышать эффективность аттестационных процессов в области образовательных стандартов;
- обеспечивать оптимальные условия для самостоятельной работы учащихся с помощью адаптивных контрольно-обучающих программ;
- повышать вариативность и доступность образовательных программ для обучающихся путем индивидуализации учебного процесса на основе адаптивного обучения;
- обеспечивать условия для дифференциации и индивидуализации массового образовательного процесса на основе адаптивных технологий тестирования;
- создавать необходимые условия для реализации идей Педагогического сотрудничества и различных технологий развивающего обучения методами адаптивного тестирования.
Создание, контрольно-обучающих программ адаптивного тестирования с разветвленными траекториями в полной мере отвечает современным мировым тенденциям в переосмыслений роли контрольно-оценочной системы в образовании, когда контроль, оценка и обучение рассматриваются как взаимосвязанные и взаимопроникающие составляющие единого образовательного процесса. Процесс обучения с помощью контрольно-обучающих программ строится так, чтобы активизировать обучающие и развивающие функции контроля, когда развитие осуществляется путем решения учебных задач. Использование компьютерных технологий позволяет существенно снизить подготовительную работу по созданию адаптивных тестов, связанную с индивидуализацией заданий, осуществить генерацию и предъявление адаптивных тестов.
Авторами был разработан и создан программно-инструментальный комплекс «СОС» ( система обратной связи), позволяющий реализовать контрольно-обучающие функции как на основе ТТ, так и на основе AT. Технологическая схема реализации «СОС» представляет собой систему компьютерных модулей оперативного контроля (МОК) учащихся, соединенных последовательно друг с другом и с портом компьютера преподавателя. При работе в режиме контроля учащиеся отвечают на тесты путем актуализации системы МОК-крмпьютер преподавателя как в режиме реального учебного времени, так и вне его. Информация об ответах учащихся оперативно обрабатывается в компьютере, и результаты тестирования демонстрируются на мониторе преподавателя и на экране видеопроектора. Преподаватель, имея результаты выполнений учебных заданий от всех учащихся по всем заданиям теста, может адекватно и оперативно вносить необходимые Коррективы в учебную деятельность каждого учащегося и всех учащихся в целом. В режиме обучения обработка ответов AT в реальном времени позволяет осуществить индивидуальные обучающие функции учащихся, реализуя тем самым идеологию адаптивного обучения. В режиме контроля применение системы «СОС» позволяет реализовать не только все виды традиционного контроля, но внедрить пошаговый контроль в каждодневную учебную деятельность. Программно-инструментальный комплекс «СОС» был апробирован в ряде школ г. Москвы и показал хорошую эффективность как в решении традиционных учебно-педагогических задач, так и в рамках инновационного подхода в образовании.
1 Rasch С, Probabilistic Models for Some Intelligence and Attainment Tests. Chicago: The Univ. Press, 1968.
2 Мельникова М.Б. Адаптивное тестирование в образовании. М., 2001.
3 Gronlund N.E. How to Construct Achievement Tests. New Jersey: Prentice – Hall, Inc., 1988.
4 Челышкова М.Б. Цит. соч.