Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности 05. 13. 01 Системный анализ, управление и обработка информации (промышленность)

Вид материалаАвтореферат
Для достижения поставленной цели в работе решены следующие задачи
Основные методы исследований
Научная новизна работы
На защиту выносится
Практическая значимость.
Реализация результатов работы.
Связь исследований с научными программами.
Апробация работы.
Личный вклад автора
Структура и объем работы.
Подобный материал:
1   2   3   4   5

Для достижения поставленной цели в работе решены следующие задачи:


проведен анализ современного состояния проблемы структурирования учебных элементов и построения интеллектуальных обучающих систем, выявлены их основные компоненты и тенденции развития;

разработана методология формализации знаний о технологических процессах, базирующаяся на автоматическом построении решающих правил методами обучения распознаванию образов;

в рамках методологии разработан подход к синтезу модели знаний на основе комплексного применения дискриминантных алгоритмов;

исследованы экстраполирующие свойства решающих правил, отличающихся легкой семантической интерпретацией при представлении технологических знаний в виде набора продукций, предложены и реализованы новые методы обучения и распознавания для различных видов априорной неопределенности;

исследованы способы повышения точности описания классов объектов, разработаны новые методы и алгоритмы оптимизации систем описания, позволяющие повысить степень сжатия информации при построении правил вывода на знаниях;

разработана методика структуризации обучающих систем технологической направленности на основе применения результатов интеллектуального анализа данных;

выполнена проверка эффективности предложенных методов и алгоритмов при разработке ряда обучающих систем в области технологии и дизайна.

Основные методы исследований. Методической и теоретической основой диссертационного исследования явились научные труды по теории распознавания образов, имитационному моделированию, структурному анализу. Широко использовались современные методы искусственного интеллекта, теории вероятностей и математической статистики, теории нечеткой логики, математического программирования, последовательного анализа. Компьютерная реализация разработанных алгоритмов производилась на основе объектно-ориентированного подхода с применением средств мультимедиа, компьютерной графики, и трудов по текстильным технологиям. Исследования предложенных методов комплексного применения множества дискриминантных алгоритмов для построения поля знаний технологического процесса проводились с использованием пакета прикладных программ, разработанного автором. Достоверность полученных результатов обеспечивалась корректностью исходных предпосылок, математической строгостью доказанных утверждений и преобразований при получении аналитических зависимостей, а также результатами практической реализации.

Научная новизна работы заключается в том, что в ней предложена, развита и реализована концепция построения модели знаний обучающих систем технологической направленности, основанная на использовании ранее не применявшихся к данной предметной области методов обучения распознаванию образов, в частности, разработаны:
  • новая методология рационального выбора и построения системы решающих правил, учитывающая виды априорной неопределенности, объем выборки, сложность систем описания объектов, емкость формируемого правила и количество классов;
  • модель знаний обучающей системы, эксплицированных специалистами и извлеченных из массива данных, в виде набора решающих правил, основанная на предложенной классификации методов обучения распознаванию образов;
  • совокупность теоретических оценок прогностических свойств решающих правил различной емкости, служащих для повышения эффективности базы знаний интеллектуальных обучающих систем;
  • новый комплексный подход к применению дискриминантных алгоритмов для синтеза модели знаний при ограниченном объеме исходных данных, позволяющий добиться более глубокого минимума гарантированной оценки риска по сравнению с известными методами обучения;
  • методика применения результатов интеллектуального анализа данных для описания трудноформализуемых технологических процессов, автоматизации построения модели знаний интеллектуальных обучающих систем и создания информационной модели обучающих систем, которая позволяет структурировать базовые понятия, декларативные фрагменты, процедурные блоки, выявлять дублирующие данные, повторяющиеся для различных технологических процессов, а также устанавливать связи-гиперссылки;
  • разработанные в рамках предложенной методологии новые методы обучения и распознавания, позволяющие легко реализовать семантическую интерпретацию решающих правил, предназначенные для различных видов априорной неопределенности, – в форме бинарной решающей матрицы, многоградационной матрицы степеней принадлежности и на основе упрощенного последовательного критерия отношения вероятностей;
  • разработанные в рамках комплексного подхода новые критерии и методы обработки информации, предназначенные для сжатия описаний классов объектов и позволяющие увеличить экстраполирующую силу известных решающих правил, а именно: методы уточнения многогранных логических классификаторов, аддитивный метод выбора рабочего словаря признаков, метод кодирования по методу минимального числа порогов, интервальный критерий информативности;
  • модель многофункциональной обучающей системы, основанная на системе решающих правил, управляющих процессом обучения, в которую заложены разные уровни усвоения учебного материала.

На защиту выносится совокупность научных результатов в области создания моделей знаний о технологических процессах.

1. Принципы рационального выбора и построения решающих правил при формировании модели знаний о технологических процессах.

2. Сравнительный анализ экстраполирующих свойств решающих правил различной сложности и методология комплексного применения дискриминантных алгоритмов в условиях ограниченных ОВ.

3. Алгоритмы обучения, формирующие логическую и нечеткую решающие матрицы; упрощенный последовательный алгоритм выделения класса с новыми потребительскими свойствами.

4. Алгоритмы кодирования, выбора информативных признаков и уточнения описаний классов при построении правил вывода на знаниях.

5. Методика структуризации и синтеза продуктивной составляющей гипертекстовых и интеллектуальных обучающих систем.

6. Результаты практического применения методов и алгоритмов обработки информации в ряде гипертекстовых и интеллектуальных обучающих систем в области технологии и дизайна.

Практическая значимость. Разработанная в диссертационной работе методология синтеза на основе комплексного применения дискриминантных алгоритмов может повысить качество модели знаний интеллектуальных систем при ограниченном обучающем материале за счет повышения экстраполирующей силы решающих правил при принятии решения по новым данным.

Методика структуризации гипертекстовых обучающих систем технологической направленности позволяет формировать гибкую, индивидуальную цепочку учебных элементов, выявляя дублирующие информационные блоки, повторяющихся для различных технологических процессов, устанавливать логические связи-гиперссылки и формировать систему правил, которые могут использоваться в обучающих системах на различных уровнях освоения учебного материала, например, в режимах тестирования или тренажера.

Формализация технологических процессов с помощью автоматического построения решающих правил позволяет решать практическую задачу эффективной семантической коммуникации между непрограммирующими авторами-педагогами и разработчиками информационной системы, являющимися специалистами в разных предметных областях, при работе над общим проектом – сценарием и наполнением обучающей системы по специальной дисциплине.

Предложенный в работе спектр методов и алгоритмов позволяет осуществлять интеллектуализацию обучающих систем по технологии и дизайну при реализации различных моделей процесса обучения. Разработанная система дизайн-программирования ассортимента производственной одежды, в которую заложены знания профессионального дизайнера, позволяет пользователю самостоятельно осуществлять проектирование одежды в соответствии с его потребностями.

Разработанная методология применения методов и алгоритмов интеллектуального анализа данных на основе выделения классов и этапности выполнения процедур может использоваться при создании обучающих систем в различных предметных областях, например, посвященных изучению технических систем, в которых последовательность действий реализуется для изменения состояния системы.

Основные результаты, полученные в работе, доведены до уровня расчетных формул, вычислительных алгоритмов или методик, что облегчает их применение при создании обучающих систем.

Реализация результатов работы. Результаты диссертационной работы реализованы, внедрены и используются в виде методологии построения модели знаний обучающих систем, методов и алгоритмов интеллектуального анализа больших массивов даных, мультимедийных программ в Санкт-Петербургском государственном университете технологии и дизайна, Балтийском государственном техническом университете “ВОЕНМЕХ”, Санкт-Петербургской Государственной Лесотехнической академии им. С.М. Кирова, что подтверждено соответствующими актами.

Разработанные обучающие системы широко используются в учебном процессе СПГУТД в курсах “Методы и средства исследований”, “Компьютерное проектирование одежды”, “Механико-технологические процессы текстильной промышленности”, “Информационное обеспечение дизайн-проектирования”, “Информационные системы в дизайне изделий легкой промышленности”, “Математическое моделирование”, “Интеллектуальные информационные системы” для студентов различных специальностей.

Связь исследований с научными программами. Работа поддерживалась следующими грантами: “Разработка аудиовизуальных компьютерных систем обучения иностранным языкам на основе новых информационных технологий” по программе "Перспективные информационные технологии" (1995–1996 г.г.); “Речевой адаптер для ЭВМ: верификация оператора и оценка его эмоционального состояния” (1995–1997 г.г.); персональным грантом “Разработка аудиовизуальной компьютерной системы обучения специалистов в области текстильной и легкой промышленности” по межвузовской комплексной программе "Наукоемкие технологии образования" (МКП НТО, 1998–1999 г.г.); “Разработка экспертных систем для оценки конкурентов” по программе Европейского Союза Tacis ERDUS 9706 “Развитие образовательных связей и инициатив в области высшего и профессионального образования”, проект Delphi – IV “Развитие ресурсов открытого и дистанционного образования” (1999–2001г.г.); грантом “Лентек № 1.5.01. Разработка теоретических основ построения интеллектуализированных компьютерных энциклопедий технологий текстильных материалов” (2001–2003 г.г.), грантом “Разработка информационно-методического и конструкторско-технологического обеспечения дизайн-программирования и изготовления ассортимента производственной одежды для служб городского хозяйства Санкт-Петербурга” по конкурсу инновационных проектов “Знания–инновации” к 300-летию Санкт-Петербурга (2003–2005 г.г.,); разработкой “Виртуальное представительство Санкт-Петербургского университета технологии и дизайна” в рамках комплексного мультимедиа и Internet проекта “Высшая школа Санкт-Петербурга в киберпространстве”, при построении комплекса инновационных разработок для образовательных учреждений высшего профессионального образования “Образовательные виртуальные миры Петербурга”, за создание которого ректору СПГУТД Романову В.Е. присуждена премия президента РФ в области образования за 2003 год (Указ № 79 от 25 января 2005 года).

Апробация работы. Основные результаты работы докладывались, одобрены и опубликованы в материалах 16 международных, 9 всероссийских и всесоюзных научных конференциях, отраженных в списке публикаций.

Личный вклад автора. Постановка основных задач и направлений исследования, отраженных в монографии [], выполнена совместно с научным консультантом Ипатовым О.С. Выбор методов исследования, анализ и обобщение полученных результатов, теоретические положения и выводы диссертации осуществлены и получены автором единолично (без соавторов). Разработка обучающих систем выполнялась под его руководством или при его участии.

Публикации. По теме диссертации опубликовано 55 работ, в том числе 9 статей в рецензируемых центральных журналах, входящих в перечень ВАК, 1 монография, 4 учебных пособия с грифом УМО, 6 свидетельств о регистрации программ.

Структура и объем работы. Диссертация состоит из введения, пяти разделов, заключения, списка использованных источников из 241 наименований. Общий объем работы – 319 страниц, в том числе основной текст – 278 страниц, 9 таблиц, 64 рисунка.