Теоретические аспекты инженерии знаний

Вид материалаЛекция

Содержание


Нечеткие знания
Нечеткие знания
Лингвинистическая переменная –
Основы теории нечетких множеств
Подобный материал:
1   2   3   4   5   6   7   8   9   10   11
^

Нечеткие знания


Проблемы принятия решений в осложненных условиях занимают в настоящее время особое место в информационных технологиях. Математические методы стали широко применяться для описания и анализа сложных экономических, социальных и других систем. Теория оптимизации создала совокупность методов, помогающих при использовании ЭВМ эффективно принимать решения при известных и фиксированных параметрах. Определенные успехи имеются и в том случае, когда параметры – случайные величины с известными законами распределения.

Однако основные трудности возникают тогда, когда параметры обстановки оказываются неопределенными (хотя, может быть, и не случайными) и когда они в то же время сильно влияют на результаты решения.

Специалисты часто сталкиваются с необходимостью расчетов при наличии в уравнениях нечетко заданных параметров или неточной технологической информации. Возникающие при этом нарушения равенств, балансовых соотношений и т.д. приводят к необходимости варьировать некоторыми параметрами для точного удовлетворения заданных уравнений и получения приемлемого результата.

В связи с тем, что при построении формальных моделей чаще всего пользуются детерминированными методами, то тем самым вносят определенность в те ситуации, где ее в действительности не существует. Неточность задания тех или иных параметров при расчетах практически не принимается во внимание или, с учетом определенных предположений и допущений, неточные параметры заменяются экспертными оценками или средними (средневзвешенными) значениями. Возникающие при этом нарушения равенств, балансовых соотношений и т.д. приводят к необходимости варьировать некоторыми параметрами для точного удовлетворения заданных уравнений и получения приемлемого результата.

Такого рода ситуации могут возникать как вследствие недостаточной изученности объектов, так и из-за участия в управлении человека или группы лиц. Особенность подобных систем состоит в том, что значительная часть информации, необходимой для их математического описания, существует в форме представлений или пожеланий экспертов. Но в языке традиционной математики нет объектов, с помощью которых можно было бы достаточно точно отразить нечеткость представлений экспертов.

Обычные количественные методы анализа систем по своей сути мало пригодны и не эффективны для такого рода систем. Это определяется так называемым принципом несовместимости: чем сложнее система, тем менее мы способны дать точные и в то же время имеющие практическое значение суждения о ее поведении. Для систем, сложность которых превосходит некоторый пороговый уровень, точность и практический смысл становятся почти исключающими. Именно в этом смысле точный количественный анализ в реальных экономических, социальных и других систем, связанных с участием человека, не имеет требуемого практического значения.

Иной подход опирается на предпосылку о том, что элементами мышления человека являются не числа, а элементы некоторых нечетких множеств или классов объектов, для которых переход от "принадлежности к классу" к "непринадлежности" не скачкообразен, а непрерывен. Традиционные методы недостаточно пригодны для анализа подобных систем именно потому, что они не в состоянии охватить нечеткость человеческого мышления и поведения.

Нравится ли это или нет, но мир руководителя – нечеткий. Это утверждение наводит на мысль о том, что для моделей процессов управления больше подошли бы нечеткие математические методы, нежели классические.

Теория нечетких (размытых) множеств была впервые предложена американским математиком Лотфи Заде в 1965 г. и предназначалась для преодоления трудностей представления неточных понятий, анализа и моделирования систем.

Для обращения с неточно известными величинами обычно применяется аппарат теории вероятностей. Однако случайность связана с неопределенностью, касающейся принадлежности некоторого объекта к обычному множеству. Это различие между нечеткостью и случайностью приводит к тому, что математические методы нечетких множеств совершенно не похожи на методы теории вероятностей. Они во многих отношениях проще вследствие того, что понятию вероятностной меры в теории вероятностей соответствует более простое понятие функции принадлежности в теории нечетких множеств. По этой причине даже в тех случаях, когда неопределенность в процессе принятия решений может быть представлена вероятностной моделью, обычно удобнее оперировать с ней методами теории нечетких множеств без привлечения аппарата теории вероятностей.

Подход на основе теории нечетких множеств является, по сути дела, альтернативой общепринятым количественным методам анализа систем. Он имеет три основные отличительные черты:

1. Вместо или в дополнение к числовым переменным используются нечеткие величины и так называемые "лингвистические" переменные;

2. Простые отношения между переменными описываются с помощью нечетких высказываний;

3. Сложные отношения описываются нечеткими алгоритмами.

Такой подход дает приближенные, но в то же время эффективные способы описания поведения систем, настолько сложных и плохо определенных, что они не поддаются точному математическому анализу. До работ Л. Заде подобная качественная информация, по существу, просто терялась, – было непонятно, как ее использовать в формальных схемах анализа альтернатив.

Теоретические же основания данного подхода вполне точны и строги в математическом смысле и не являются сами по себе источником неопределенности. В каждом конкретном случае степень точности решения может быть согласована с требованиями задачи и точностью имеющихся данных. Подобная гибкость составляет одну из важных черт рассматриваемого метода.

Основные приложения данного подхода находятся в таких областях, как искусственный интеллект, лингвистика, поиск информации, процессы принятия решений, распознавание образов, медицинская диагностика, психология, право, экономика и других областях человеческой деятельности.


^ Нечеткие знания

При попытке формализовать человеческие знания исследователи вскоре столкнулись с проблемой, затруднявшей использование традиционного математического аппарата для их описания. Существует целый класс описаний, оперирующих качественными характеристиками объектов (много, мало, сильный, очень сильный и т. п.). Эти характеристики обычно размыты и не могут быть однозначно интерпретированы, однако содержат важную информацию (например, «Одним из возможных признаков гриппа является высокая температура»).

Кроме того, в задачах, решаемых интеллектуальными системами, часто приходится пользоваться неточными знаниями, которые не могут быть интерпретированы как полностью истинные или ложные (логические true/false или 0/1). Существуют знания, достоверность которых выражается некоторой промежуточной цифрой, например 0.7.

Как, не разрушая свойства размытости и неточности, представлять подобные зна­ния формально? Для разрешения таких проблем американский математик Лотфи Заде предложил формальный аппарат нечеткой (fuzzy) алгебры и нечеткой логики [Заде, 1972]. Позднее это направление получило широкое распространение [Орловский, 1981; Аверкин и др., 1986; Яшин, 1990] и положило на­чало одной из ветвей ИИ под названием — мягкие вычисления (soft computing).

Л. Заде ввел одно из главных понятий в нечеткой логике — понятие лингвистической переменной.

^ Лингвинистическая переменная – это переменная, значение которой определяется набором вербальных (то есть словесных) характеристик некоторого свойства.

Например, ЛП «рост» определяется через набор {карликовый, низкий, средний, высокий, очень высокий}.


^ Основы теории нечетких множеств

Значения лингвистической переменной (ЛП) определяются через так называемые нечеткие множества (НМ), которые в свою очередь определены на некото­ром базовом наборе значений или базовой числовой шкале, имеющей размер­ность. Каждое значение ЛП определяется как нечеткое множество (например, НМ «низкий рост»).

Нечеткое множество определяется через некоторую базовую шкалу и функцию
принадлежности НМ , принимающую значения на интервале [0...1].
Таким образом, нечеткое множество – это совокупность пар вида где
. Часто встречается и такая запись:





где – i-e значение базовой шкалы.

Функция принадлежности определяет субъективную степень уверенности эксперта в том, что данное конкретное значение базовой шкалы соответствует определяемому НМ. Эту функцию не стоит путать с вероятностью, носящей объективный характер и подчиняющейся другим математическим зависимостям.

Например, для двух экспертов определение НМ «высокая» для ЛП «цена автомобиля» в условных единицах может существенно отличаться в зависимости от их социального и финансового положения.

«Высокая_цена_автомобиля_1» = {50000/1 + 25000/0.8 + 10000/0.6 + 5000/0.4}. «Высокая_цена_автомобиля_2» = {25000/1 + 10000/0.8 + 5000/0.7 + 3000/0.4}


Пример.

Пусть перед нами стоит задача интерпретации значений ЛП «возраст», таких как «молодой» возраст, «преклонный» возраст или «переходный» возраст.

Определим «возраст» как ЛП. Тогда «молодой», «преклонный», «переходный» будут значениями этой лингвистической переменной. Более полно, базовый набор значений ЛП «возраст» следующий:


В = {младенческий, детский, юный, молодой, зрелый, преклонный, старческий}.


Для ЛП «возраст» базовая шкала – это числовая шкала от 0 до 120, обозначающая количество прожитых лет, а функция принадлежности определяет, насколько мы уверены в том, что данное количество лет можно отнести к данной категории возраста.

Таблица 4.1

Младенческий возраст

"младенческий"

0,5

1

2

3

4

5

10

1

0,9

0,8

0,7

0,6

0,3

0,1


Данные в табл.4.1 иллюстрируют оценку НМ неким усредненным экспертом, который ребенка до полугода с высокой степенью уверенности относит к младенцам (m = 1). Дети до четырех лет причисляются к младенцам тоже, но с меньшей степенью уверенности (0.5< m <0.9), а в десять лет ребенка называют так только в очень редких случаях, – к примеру, для девяностолетней бабушки и 15 лет может считаться младенчеством. Таким образом, нечеткие множества позволяют при определении понятия учитывать субъективные мнения отдельных индивидуумов.






Рис.4.1. График функции принадлежности нечеткому множеству "младенческий возраст"



Разработка нечетких правил

Большинство нечетких систем используют продукционные правила для описания зависимостей между лингвистическими переменными. Типичное продукционное правило состоит из антецедента (часть ЕСЛИ …) и консеквента (часть ТО …). Антецедент может содержать более одной посылки. В этом случае они объединяются посредством логических связок И или ИЛИ.

Процесс вычисления нечеткого правила называется нечетким логическим выводом и подразделяется на два этапа: обобщение и заключение.


Пример.


На объекте управления значение температуры является основным параметром для идентификации критической ситуации. Эксперты проанализировали все возможные аварийные ситуации и предложили следующую шкалу температур:
  • очень низкая (ОН);
  • низкая (Н);
  • высокая (В);
  • очень высокая.


График функции принадлежности представлен на рис 4.2.




m

Рис.4.2. График функции принадлежности параметра "температура"


Аварийная ситуация, в свою очередь, определяет степень готовности и количество аварийно-спасательных бригад. Эксперты так классифицировали взаимосвязь этих событий (Рис.4.3).




m

Рис.4.3. График функции принадлежности параметра "температура"


На рис.4.3, приведены следующие сокращения:
  • штатный режим (Ш);
  • повышенной готовности (ПГ);
  • режим ликвидации аварии (РЛ);
  • режим катастрофы (РК).


Сформулируем следующее правило:

ЕСЛИ «Температура»=высокая, ТО «Ситуация»=режим ликвидации

В приведенном примере логического правила возникает вопрос: Какое количество аварийных бригад необходимо подготовить, исходя из анализа возникшей ситуации?

Алгоритм вычисления следующий:
  1. Определить текущее значение температуры. Например, t=265.
  2. По соответствующему графику (рис.2) функции принадлежности определить уровень достоверности по шкале (1>m >0), (t=265, m=0,75).

Определить по графику (рис.3) для уровня m=0,75 функции принадлежности количество аварийных бригад. К=23.