Л. Я. Поспелова, вц ран, poljak6@rambler ru Н. Ю. Пустовойтов, мфти (ГУ) flashnik86@gmail com О. В. Чуканова, мфти (ГУ), ovcha@mail ru
Вид материала | Документы |
Содержание2. Практические задачи 3. Особенности структуры приложения 4. Полученные эвристические тенденции и правила 5. Описание алгоритмов Дефекты в базах знаний Научная обоснованность |
- Безошибочное обращение плохо обусловленных матриц в распределенной среде restful веб-сервисов, 106.98kb.
- Аспирантура Московского Физико-Технического Института (Университета) мфти; Московский, 144.46kb.
- Всероссийская школа для студентов, аспирантов, молодых ученых и специалистов по лазерной, 39.95kb.
- Спецкурс «Химия нуклеиновых кислот и основы генной инженерии» для студентов 4 курса, 23.71kb.
- Веселаго Виктор Георгиевич, доктор физико-математических наук, профессор мфти, область, 30.58kb.
- Труды мфти, т. 1, №1, 2009г., с. 5-16, 225.69kb.
- Методическое пособие по боксу Вашему вниманию предлагается методическое пособие, 281.8kb.
- Урок физики на тему «Теория фотоэффекта», 99.79kb.
- Крель А. В. магистрант мфти (ниу) Клочков, 194.02kb.
- Новый пароль, улыбаясь, вводил, 224.29kb.
Разработка интеллектуальной информационной системы прогнозирования качества подготовки специалистов в наукоемких областях деятельности1
Л. Я. Поспелова, ВЦ РАН, poljak6@rambler.ru
Н.Ю. Пустовойтов, МФТИ (ГУ) flashnik86@gmail.com
О. В. Чуканова, МФТИ (ГУ), ovcha@mail.ru
Описывается внедрение информационных технологий (ИТ) как механизма организационно-информационного сопровождения образовательной деятельности на всех уровнях подготовки специалистов и прогнозирования качества подготовки специалистов. Рассматривается подход к созданию интеллектуальной системы прогнозирования качества подготовки будущих выпускников (специалистов исследователей в области естественных наук) на основе данных полученных из раннее разработанной базы знаний (системы накопления и анализа информации по сопровождению подготовки специалистов) на примере МФТИ.
1. Введение
Цель исследования – разработка технологии поддержки систем сопровождения подготовки специалистов и прогнозирования качества подготовки специалистов в области естественных наук.
Предметом исследования является методология реализации многоуровневой системы отбора обучаемых, методология последовательного формирования у обучаемых этики долга по отношению к себе, стремления к самореализации.
Предлагаемые исследования также используют оригинальные теоретические и практические результаты исследований, проводимых в ВЦ РАН в области создания систем моделирования, основанных на знаниях и в области интеллектуального анализа данных.
2. Практические задачи
Предлагаемая работа направлена на разработку интеллектуальной системы прогнозирования качества подготовки будущих выпускников (специалистов исследователей в области естественных наук) на основе данных, полученных из раннее разработанной базы знаний (системы накопления и анализа информации по сопровождению подготовки специалистов) на примере МФТИ. В рамках проекта предполагается:
1) Развить технологии создания подобной системы и развить информационные модели процесса оценки качества подготовки будущих специалистов. Разработка модели подразумевает как уточнение созданной ранее информационной модели процесса в виде базы фактов и базы знаний (по обучающимся и преподавателям, информации о специфике подготовки и достижениях каждого специалиста на этапах обучения, побед на олимпиадах, получения ученых степеней и званий, свершения открытий, руководство и участие в крупных исследовательских проектах, или сход с любого этапа дистанции), так модификацию и накопление процедурной части модели управления.
2) Продолжить разработку методов генерации предсказательного и нормативного прогнозов определяющих характеристик будущего специалиста (качество подготовки) с учетом, как предыстории его индивидуального образовательного процесса, так и накопленных прецедентов, уточнение методик генерации такого прогноза.
Для принятия решений будет использована как методика логического вывода на основе накопленных прецедентов и рецептов, используемая в экспертных системах, так и опыт использования систем с самообучением, систем моделирования с неполной информацией. Предполагается использовать методы индуктивного логического вывода и провести их анализ с целью выявления методов более подходящих для анализа данных о будущих выпускниках
3) Развить методы выявления степени сходства и различия между выбранными представителями объектов.
4) Развить методы выявления наиболее и наименее значимых характеристик объектов.
3. Особенности структуры приложения
На основании содержательного анализа приложения выявлены следующие особенности информационной модели процесса отбора. В работе [1] приведены результаты анализа укороченного бакалаврского цикла (Абитуриент→ Студент → Бакалавр) обучения в МФТИ. В данной главе представлены дополнительные к результатам эмпирические данные о полном (Школьник→ Олимпиадник→Абитуриент→ Студент → Бакалавр) цикле обучения тех студентов, которые получали довузовское образование МФТИ и проходили отбор через олимпиадное движение. Многоступенчатый отбор в нашем исследовании представлен следующими испытаниями, результаты которых учитывались при начислении вступительных баллов:
- Участник международных сборных России;
- Финал России;
- Третий и Четвертый этапы Всероссийских олимпиад;
- Физтех-Абитуриент;
- Вступительные экзамены;
- Участник международных сборных других стран СНГ;
- Физтех-Абитуриент плюс Вступительные экзамены;
- Старт в науку и др. олимпиады МФТИ;
- ЕГЭ (введено с 2004 г.)
Анализ и учет более глубокой предыстории позволяет выстроить более обоснованные логические закономерности поведения обучаемых.
4. Полученные эвристические тенденции и правила
Знания будем представлять системой продукций. Значения коэффициентов уверенности по выпускам двух лет в большинстве случаев мы оцениваем, исходя из пессимистических ожиданий, в остальных случаях берем среднее значение.
Эмпирические правила прогнозирования результатов обучения в МФТИ участников олимпиадного движения. Некоторые примеры (полученные из результатов обработки статистической информации):
Если студент МФТИ и олимпиадник и был в Финале России, то он заканчивал бакалавриат либо с Красным дипломом, либо на 4 и 5 (с коэффициентом уверенности 0.95).
Если студент МФТИ и прошел по баллам ЕГЭ, то он может быть отчислен (с коэффициентом уверенности 0.3).
Если студент МФТИ и прошел по баллам ЕГЭ, то он закончит без троек (с коэффициентом уверенности 0.5).
Эмпирические правила прогнозирования результатов обучения в МФТИ с учетом территориального признака. Примеры:
Если МФТИ, то с Красным диплом окончат бакалавриат ≈ 16% (Min(16, 17)) от общей численности МФТИ.
Если МФТИ, то будут отчислены ≈ 23% от общей численности МФТИ
Если МФТИ, то закончат бакалавриат в срок ≈ 70% от общей численности МФТИ.
Если МФТИ, и студенты - из Москвы или МО или областей РФ, то закончат бакалавриат в срок ≈ 70% от своего состава (не самый высокий результат по МФТИ)
Если МФТИ и студенты из МО или областей РФ, то без троек окончат бакалавриат более 53% своего состава.(средний результат по МФТИ, по пессимистическому сценарию).
Те же правила можно получить и по каждому факультету в отдельности.
Выявленные эвристические тенденции и закономерности процесса отбора представлены продукциями. Описаны основанные на динамическом подходе алгоритмы логического вывода и поиска противоречий в системе продукций. Программный комплекс для создания, тестирования и интерпретации продукционных баз знаний разработан на С++ в среде MS VS 2005.
5. Описание алгоритмов
Прямой вывод
Прямой вывод – это вывод от данных к цели. Изначально слово состояния пусто. Сеанс работы ЭС в режиме прямого вывода начинается с этапа заполнения слова состояния теми фактами, истинность которых подтвердил пользователь в процессе диалога. Другими словами, система последовательно задает вопросы пользователю, получает ответ, на основании ответа делает заключение об истинности некоторого факта, наконец, истинный факт добавляется к слову состояния – сведения о мире расширяются.
После того, как путем полного опроса сформировано слово состояния, оно может быть отсортировано и/или отфильтровано с помощью метазнаний, отражающих специфику приложения. Например, могут быть заданы маски для допустимых или недопустимых состояний.
На следующем этапе начинается, собственно, сам прямой вывод: сопоставление условий каждого правила с содержимым слова состояния. Если все условия некоторого правила истинны (содержатся в слове состояния), то (согласно правилу вывода modus ponens) и заключение этого правила истинно. Факт-заключение добавляется к слову состояния. Мир расширяется.
Обратный вывод
Механизм обратного вывода – от цели к данным – включает следующие функции:
- систематический выбор целей,
- выбор и оценка (идентификация) правил,
- интерактивный запрос от пользователя истинных фактов для достижения конечной цели.
I. Первый шаг в сеансе работы ЭС в режиме обратного вывода – это выбор цели (выбор целевого атрибута).
II. Второй шаг – это просмотр заключений (правых частей) продукций Базы правил. Из множества правил, у которых совпали АТРИБУТЫ заключительной части с АТРИБУТОМ текущей цели, организуется конфликтный набор. Говорят, что между этими правилами существует коллизия: какое правило является приоритетным для оценки. Процедура разрешения коллизии – это способ выбора правила из конфликтного набора. Существует ряд способов повышения эффективности выбора требуемой продукции:
III. После того, как мы выбрали правило из конфликтного набора, мы должны его идентифицировать (оценить), т.е. сравнить одно за другим все условия правила с фактами слова состояния.
При реализации обратного вывода существует возможность отката ЭС в некоторое предыдущее состояние, чтобы применить альтернативную продукцию из конфликтного набора. Наиболее распространенной стратегией с возможностью возвращения является backtracking.
Дефекты в базах знаний
Достоверность принимаемых ЭС решений в значительной степени определяется отсутствием дефектов в базе знаний (БЗ).
Ниже перечислим лишь основные требования к БЗ:
Научная обоснованность. В БЗ следует включать знания только высококвалифицированных специалистов. Иначе ЭС будет производить впечатление глупой.
Полнота. ЭС по возможности должна отвечать на все вопросы в рамках конкретной проблемной области. Иначе ЭС будет выглядеть некомпетентной.
Непротиворечивость. ЭС должна давать четкие непротиворечивые ответы-рекомендации на любые заданные вопросы в рамках приложения. Иначе путаный и сбивчивый диалог с ЭС будет характеризовать ее как бестолковую.
Эргономичность. ЭС должна естественным образом имитировать рутинную работу специалистов в сфере их профессиональной деятельности. Иначе ЭС будет неестественной.
Проверка БЗ на состоятельность и непротиворечивость может рассматриваться как этап решения сложной проблемы передачи знаний от эксперта-человека к компьютерной системе. Ошибки могут возникать на любой стадии этого процесса.
Знания самого эксперта могут быть неполными или противоречивыми.
Даже полные и согласованные знания могут быть неадекватно переведены в машинной представление. Эта ситуация типична для случая, когда эксперт, не знакомый с информационными технологиями, работает с инженером по знаниям, имеющим поверхностное представление о проблемной области. Такие ошибки часто выявляются только на стадии эксплуатации ЭС.
Орфографические и семантические ошибки, возникающие при вводе данных в компьютер, также могут стать источником противоречий или пробелов в БЗ.
Основные дефекты продукционных БЗ:
- Противоречивость.
- Избыточность.
- Неполнота.
Лишь о некоторых видах дефектов БЗ можно с уверенностью говорить, как об ошибках, которые должны быть обязательно устранены. Например, БЗ не должна содержать правил, применяемых в одной и той же ситуации, но делающих противоположные выводы. В медицинской диагностике это могут быть два взаимоисключающих диагноза: “Истощение” и “Ожирение”. В технической ЭС – это две рекомендации: “Тумблер включить” и “Тумблер выключить”. В прогнозирующей ЭС – “Студенты закончили с Красным дипломом” и “Студенты исключены.”
В большинстве случаях степень допустимости того или иного дефекта БЗ определяется индивидуально и может зависеть от целей системы, семантики конкретной предметной области, формы представления знаний и пр.
Поэтому автоматическая проверка БЗ в общем случае позволяет выявлять лишь возможные ошибки. Только эксперт принимает окончательное решение о том, какие из них являются действительно недопустимыми и должны быть устранены.
Идея алгоритма поиска противоречий в СП в рамках динамического подхода приведена в [1, 3].
На следующем этапе работ планируется создание методов генерации предсказательного и нормативного прогнозов определяющих характеристик будущего специалиста (качество подготовки) с учетом, как предыстории его индивидуального образовательного процесса, так и накопленных прецедентов, уточнение методик генерации такого прогноза
Литература
1. Поспелова Л.Я., Чуканова О.В. Разработка методов и инструментальных средств создания систем сопровождения подготовки специалистов. Сообщения по прикладной математике. М., ВЦ РАН. 2007. 70 с.
2. Поспелова Л.Я., Чуканова О.В. Информационно-аналитическая система сопровождения подготовки специалистов на примере МФТИ. Труды XIV Всероссийской научно-методической конференции “Телематика‘2007”. СПб.: СПбГУ ИТМО. 2007. Т 2. С. 356-358.
3. Поспелов И.Г., Поспелова Л.Я. Динамическое описание систем продукций и проверка непротиворечивости продукционных экспертных систем. Изв. АН СССР “Техническая кибернетика”. 1987. № 1. С. 184-192.
1 Работа выполнена при финансовой поддержке Российского Фонда Фундаментальных Исследований (код проекта 09-07-00461-а).
- -