Л. Я. Поспелова, вц ран, poljak6@rambler ru Н. Ю. Пустовойтов, мфти (ГУ) flashnik86@gmail com О. В. Чуканова, мфти (ГУ), ovcha@mail ru

Вид материалаДокументы

Содержание


2. Практические задачи
3. Особенности структуры приложения
4. Полученные эвристические тенденции и правила
5. Описание алгоритмов
Дефекты в базах знаний
Научная обоснованность
Подобный материал:

Разработка интеллектуальной информационной системы прогнозирования качества подготовки специалистов в наукоемких областях деятельности1

Л. Я. Поспелова, ВЦ РАН, poljak6@rambler.ru
Н.Ю. Пустовойтов, МФТИ (ГУ) flashnik86@gmail.com
О. В. Чуканова, МФТИ (ГУ), ovcha@mail.ru


Описывается внедрение информационных технологий (ИТ) как механизма организационно-информационного сопровождения образовательной деятельности на всех уровнях подготовки специалистов и прогнозирования качества подготовки специалистов. Рассматривается подход к созданию интеллектуальной системы прогнозирования качества подготовки будущих выпускников (специалистов исследователей в области естественных наук) на основе данных полученных из раннее разработанной базы знаний (системы накопления и анализа информации по сопровождению подготовки специалистов) на примере МФТИ.

1. Введение

Цель исследования – разработка технологии поддержки систем сопровождения подготовки специалистов и прогнозирования качества подготовки специалистов в области естественных наук.

Предметом исследования является методология реализации многоуровневой системы отбора обучаемых, методология последовательного формирования у обучаемых этики долга по отношению к себе, стремления к самореализации.

Предлагаемые исследования также используют оригинальные теоретические и практические результаты исследований, проводимых в ВЦ РАН в области создания систем моделирования, основанных на знаниях и в области интеллектуального анализа данных.

2. Практические задачи

Предлагаемая работа направлена на разработку интеллектуальной системы прогнозирования качества подготовки будущих выпускников (специалистов исследователей в области естественных наук) на основе данных, полученных из раннее разработанной базы знаний (системы накопления и анализа информации по сопровождению подготовки специалистов) на примере МФТИ. В рамках проекта предполагается:

1) Развить технологии создания подобной системы и развить информационные модели процесса оценки качества подготовки будущих специалистов. Разработка модели подразумевает как уточнение созданной ранее информационной модели процесса в виде базы фактов и базы знаний (по обучающимся и преподавателям, информации о специфике подготовки и достижениях каждого специалиста на этапах обучения, побед на олимпиадах, получения ученых степеней и званий, свершения открытий, руководство и участие в крупных исследовательских проектах, или сход с любого этапа дистанции), так модификацию и накопление процедурной части модели управления.

2) Продолжить разработку методов генерации предсказательного и нормативного прогнозов определяющих характеристик будущего специалиста (качество подготовки) с учетом, как предыстории его индивидуального образовательного процесса, так и накопленных прецедентов, уточнение методик генерации такого прогноза.

Для принятия решений будет использована как методика логического вывода на основе накопленных прецедентов и рецептов, используемая в экспертных системах, так и опыт использования систем с самообучением, систем моделирования с неполной информацией. Предполагается использовать методы индуктивного логического вывода и провести их анализ с целью выявления методов более подходящих для анализа данных о будущих выпускниках

3) Развить методы выявления степени сходства и различия между выбранными представителями объектов.

4) Развить методы выявления наиболее и наименее значимых характеристик объектов.

3. Особенности структуры приложения

На основании содержательного анализа приложения выявлены следующие особенности информационной модели процесса отбора. В работе [1] приведены результаты анализа укороченного бакалаврского цикла (Абитуриент→ Студент → Бакалавр) обучения в МФТИ. В данной главе представлены дополнительные к результатам эмпирические данные о полном (Школьник→ Олимпиадник→Абитуриент→ Студент → Бакалавр) цикле обучения тех студентов, которые получали довузовское образование МФТИ и проходили отбор через олимпиадное движение. Многоступенчатый отбор в нашем исследовании представлен следующими испытаниями, результаты которых учитывались при начислении вступительных баллов:
  • Участник международных сборных России;
  • Финал России;
  • Третий и Четвертый этапы Всероссийских олимпиад;
  • Физтех-Абитуриент;
  • Вступительные экзамены;
  • Участник международных сборных других стран СНГ;
  • Физтех-Абитуриент плюс Вступительные экзамены;
  • Старт в науку и др. олимпиады МФТИ;
  • ЕГЭ (введено с 2004 г.)

Анализ и учет более глубокой предыстории позволяет выстроить более обоснованные логические закономерности поведения обучаемых.

4. Полученные эвристические тенденции и правила

Знания будем представлять системой продукций. Значения коэффициентов уверенности по выпускам двух лет в большинстве случаев мы оцениваем, исходя из пессимистических ожиданий, в остальных случаях берем среднее значение.

Эмпирические правила прогнозирования результатов обучения в МФТИ участников олимпиадного движения. Некоторые примеры (полученные из результатов обработки статистической информации):

Если студент МФТИ и олимпиадник и был в Финале России, то он заканчивал бакалавриат либо с Красным дипломом, либо на 4 и 5 (с коэффициентом уверенности 0.95).

Если студент МФТИ и прошел по баллам ЕГЭ, то он может быть отчислен (с коэффициентом уверенности 0.3).

Если студент МФТИ и прошел по баллам ЕГЭ, то он закончит без троек (с коэффициентом уверенности 0.5).

Эмпирические правила прогнозирования результатов обучения в МФТИ с учетом территориального признака. Примеры:

Если МФТИ, то с Красным диплом окончат бакалавриат ≈ 16% (Min(16, 17)) от общей численности МФТИ.

Если МФТИ, то будут отчислены ≈ 23% от общей численности МФТИ

Если МФТИ, то закончат бакалавриат в срок ≈ 70% от общей численности МФТИ.

Если МФТИ, и студенты - из Москвы или МО или областей РФ, то закончат бакалавриат в срок ≈ 70% от своего состава (не самый высокий результат по МФТИ)

Если МФТИ и студенты из МО или областей РФ, то без троек окончат бакалавриат более 53% своего состава.(средний результат по МФТИ, по пессимистическому сценарию).

Те же правила можно получить и по каждому факультету в отдельности.

Выявленные эвристические тенденции и закономерности процесса отбора представлены продукциями. Описаны основанные на динамическом подходе алгоритмы логического вывода и поиска противоречий в системе продукций. Программный комплекс для создания, тестирования и интерпретации продукционных баз знаний разработан на С++ в среде MS VS 2005.

5. Описание алгоритмов

Прямой вывод

Прямой вывод – это вывод от данных к цели. Изначально слово состояния пусто. Сеанс работы ЭС в режиме прямого вывода начинается с этапа заполнения слова состояния теми фактами, истинность которых подтвердил пользователь в процессе диалога. Другими словами, система последовательно задает вопросы пользователю, получает ответ, на основании ответа делает заключение об истинности некоторого факта, наконец, истинный факт добавляется к слову состояния – сведения о мире расширяются.

После того, как путем полного опроса сформировано слово состояния, оно может быть отсортировано и/или отфильтровано с помощью метазнаний, отражающих специфику приложения. Например, могут быть заданы маски для допустимых или недопустимых состояний.

На следующем этапе начинается, собственно, сам прямой вывод: сопоставление условий каждого правила с содержимым слова состояния. Если все условия некоторого правила истинны (содержатся в слове состояния), то (согласно правилу вывода modus ponens) и заключение этого правила истинно. Факт-заключение добавляется к слову состояния. Мир расширяется.

Обратный вывод

Механизм обратного вывода – от цели к данным – включает следующие функции:
  • систематический выбор целей,
  • выбор и оценка (идентификация) правил,
  • интерактивный запрос от пользователя истинных фактов для достижения конечной цели.

I. Первый шаг в сеансе работы ЭС в режиме обратного вывода – это выбор цели (выбор целевого атрибута).

II. Второй шаг – это просмотр заключений (правых частей) продукций Базы правил. Из множества правил, у которых совпали АТРИБУТЫ заключительной части с АТРИБУТОМ текущей цели, организуется конфликтный набор. Говорят, что между этими правилами существует коллизия: какое правило является приоритетным для оценки. Процедура разрешения коллизии – это способ выбора правила из конфликтного набора. Существует ряд способов повышения эффективности выбора требуемой продукции:

III. После того, как мы выбрали правило из конфликтного набора, мы должны его идентифицировать (оценить), т.е. сравнить одно за другим все условия правила с фактами слова состояния.

При реализации обратного вывода существует возможность отката ЭС в некоторое предыдущее состояние, чтобы применить альтернативную продукцию из конфликтного набора. Наиболее распространенной стратегией с возможностью возвращения является backtracking.

Дефекты в базах знаний

Достоверность принимаемых ЭС решений в значительной степени определяется отсутствием дефектов в базе знаний (БЗ).

Ниже перечислим лишь основные требования к БЗ:

Научная обоснованность. В БЗ следует включать знания только высококвалифицированных специалистов. Иначе ЭС будет производить впечатление глупой.

Полнота. ЭС по возможности должна отвечать на все вопросы в рамках конкретной проблемной области. Иначе ЭС будет выглядеть некомпетентной.

Непротиворечивость. ЭС должна давать четкие непротиворечивые ответы-рекомендации на любые заданные вопросы в рамках приложения. Иначе путаный и сбивчивый диалог с ЭС будет характеризовать ее как бестолковую.

Эргономичность. ЭС должна естественным образом имитировать рутинную работу специалистов в сфере их профессиональной деятельности. Иначе ЭС будет неестественной.

Проверка БЗ на состоятельность и непротиворечивость может рассматриваться как этап решения сложной проблемы передачи знаний от эксперта-человека к компьютерной системе. Ошибки могут возникать на любой стадии этого процесса.

Знания самого эксперта могут быть неполными или противоречивыми.

Даже полные и согласованные знания могут быть неадекватно переведены в машинной представление. Эта ситуация типична для случая, когда эксперт, не знакомый с информационными технологиями, работает с инженером по знаниям, имеющим поверхностное представление о проблемной области. Такие ошибки часто выявляются только на стадии эксплуатации ЭС.

Орфографические и семантические ошибки, возникающие при вводе данных в компьютер, также могут стать источником противоречий или пробелов в БЗ.

Основные дефекты продукционных БЗ:
  • Противоречивость.
  • Избыточность.
  • Неполнота.

Лишь о некоторых видах дефектов БЗ можно с уверенностью говорить, как об ошибках, которые должны быть обязательно устранены. Например, БЗ не должна содержать правил, применяемых в одной и той же ситуации, но делающих противоположные выводы. В медицинской диагностике это могут быть два взаимоисключающих диагноза: “Истощение” и “Ожирение”. В технической ЭС – это две рекомендации: “Тумблер включить” и “Тумблер выключить”. В прогнозирующей ЭС – “Студенты закончили с Красным дипломом” и “Студенты исключены.”

В большинстве случаях степень допустимости того или иного дефекта БЗ определяется индивидуально и может зависеть от целей системы, семантики конкретной предметной области, формы представления знаний и пр.

Поэтому автоматическая проверка БЗ в общем случае позволяет выявлять лишь возможные ошибки. Только эксперт принимает окончательное решение о том, какие из них являются действительно недопустимыми и должны быть устранены.

Идея алгоритма поиска противоречий в СП в рамках динамического подхода приведена в [1, 3].

На следующем этапе работ планируется создание методов генерации предсказательного и нормативного прогнозов определяющих характеристик будущего специалиста (качество подготовки) с учетом, как предыстории его индивидуального образовательного процесса, так и накопленных прецедентов, уточнение методик генерации такого прогноза

Литература

1. Поспелова Л.Я., Чуканова О.В. Разработка методов и инструментальных средств создания систем сопровождения подготовки специалистов. Сообщения по прикладной математике. М., ВЦ РАН. 2007. 70 с.

2. Поспелова Л.Я., Чуканова О.В. Информационно-аналитическая система сопровождения подготовки специалистов на примере МФТИ. Труды XIV Всероссийской научно-методической конференции “Телематика‘2007”. СПб.: СПбГУ ИТМО. 2007. Т 2. С. 356-358.

3. Поспелов И.Г., Поспелова Л.Я. Динамическое описание систем продукций и проверка непротиворечивости продукционных экспертных систем. Изв. АН СССР “Техническая кибернетика”. 1987. № 1. С. 184-192.

1 Работа выполнена при финансовой поддержке Российского Фонда Фундаментальных Исследований (код проекта 09-07-00461-а).

- -