Ix национальная конференция с международным участием "Искусственный интеллект-2004", Тверь, Сентябрь 8-11, 2004, Труды конференции в 2 томах, т. 1, с. 11 20

Вид материалаДоклад
Подобный материал:
IX Национальная конференция с международным участием “Искусственный интеллект-2004”, Тверь, Сентябрь 8-11, 2004,

Труды конференции в 2 томах, т.1, с.11 – 20.

Пленарный доклад


Искусственный интеллект:

идейная база и основной продукт

Финн В.К.

Сектор интеллектуальных систем,

Всероссийский институт научной и технической информации,

125190, г. Москва, ул. Усиевича, д.20

finn@viniti.ru;


Искусственный интеллект (ИИ) как направление исследований и их результат является аппроксимацией интеллекта естественного, точнее, совокупности способностей, образующих его реальный феномен. Таковыми являются:
  1. способность выделять существенное в наличных знаниях, т.е. упорядочивать их (она – необходимый аспект интуиции);
  2. способность к целеполаганию и планированию поведения: порождение последовательностей: «цель  план  действие»;
  3. способность к отбору знаний (посылок выводов релевантных цели рассуждения);
  4. способность извлекать следствия из имеющихся знаний, т.е. способность к рассуждению, которое может содержать как правдоподобные выводы, используемые для выдвижения гипотез, так и достоверные выводы (следовательно, под рассуждением понимается как достоверные, так и правдоподобные рассуждения);
  5. способность к аргументированному принятию решений, использующему упорядоченные знания, (т.е. представление знаний) и результаты рассуждений;
  6. способность к рефлексии: оценки знаний и действий;
  7. наличие познавательного любопытства: познающий субъект должен быть способен порождать вопрос что такое? и искать на него ответ;
  8. способность и потребность находить объяснение (не обязательно дедуктивное!) как ответ на вопрос «почему?» (это реализация абдуктивного инстинкта в смысле Ч.С. Пирса);
  9. способность к синтезу познавательных процедур, образующих эвристику решения задач и рассмотрения проблем: например, реализация взаимодействия индукции, аналогии и абдукции (с учетом фальсификации выдвигаемых гипотез посредством поиска контрпримеров) с последующим применением дедукции;
  10. способность к обучению и использованию памяти;
  11. способность к рационализации идей: стремление уточнить их как понятия;
  12. способность к созданию целостной картины относительно предмета мышления (формирование, по крайней мере, приближенной «теории» предметной области);
  13. способность к адаптации в условиях изменения жизненных ситуаций и знаний (что означает коррекцию «теорий» и поведения).

Продуктом исследований дисциплины ИИ являются компьютерные системы, осуществляющие конструктивное приближение способностей, образующих идею интеллекта в охарактеризованном выше смысле. «Ядром» этого приближения являются способности необходимые для реализации рассуждений и представления знаний, к которым они применимы.

Однако следует отметить, что приведенная выше характеризация феномена естественного интеллекта является лишь идеальным типом в смысле Макса Вебера, выражающим существенные черты этого феномена (разумеется, не всегда присущего конкретному индивиду).

Компьютерные системы, которые являются автоматизацией приближений идеи интеллекта, содержащие упомянутое выше «ядро», естественно называть интеллектуальными системами (ИС). Они и являются основным практически значимым продуктом дисциплины ИИ.

ИС обладают специфической архитектурой, допускающей определенные вариации. Схематически эта архитектура может быть представлена следующим образом:

ИС = Решатель задач + Информационная среда + Интеллектуальный интерфейс. Решатель задач = Рассуждатель + Вычислитель + Синтезатор. Информационная среда ИС состоит из базы фактов (БФ) и базы знаний (БЗ). БФ представляет рассматриваемую предметную область («замкнутый мир» или «открытый мир»; в первом случае БФ не изменяется, во втором – возможно ее пополнение в соответствии с результатами, полученными Решателем задач, и желаниями пользователя ИС как человеко-машинной системы).

Можно выделить три типа предметных областей W («миров»):
  1. предметные области («миры», «универсумы») такие, что факты, принадлежащие W, являются случайными событиями; соответственно, правила Решателя, применяемые в рассуждениях о W, используют аппарат теории вероятностей (в т.ч. различные статистические методы анализа данных);
  2. предметные области W такие, что факты, принадлежащие W, причинно обусловлены; соответственно, правила Решателя, применяемые в рассуждениях о W, порождают гипотезы о причинно-следственных зависимостях и основанных на них обобщениях;
  3. предметные области W такие, что факты, принадлежащие W, могут быть как причинно обусловленными, так и случайными (это означает, что этот «мир» является объединением «миров» (1) и (2)); рассуждения, представленные в Решателе задач, соответствующие этому «миру», должны использовать правила, порождающие гипотезы о зависимостях причинно-следственного типа с учетом вероятностных соображений (например, частоты появления причинно-следственного эффекта)

ИС высокого уровня должна удовлетворять принципу адекватности типа W и средств Решателя задач (в т.ч. Рассуждателя).

Третьей компонентой ИС является интерфейс (точнее, интеллектуальный интерфейс). Интерфейс ИС включает в себя диалог (наилучший вариант – диалог на естественном языке), демонстрацию как результатов работы ИС, так и процесса их получения, графическое представление результатов, научение пользователя работе с ИС, поддержка интерактивного режима работы ИС. Рассуждатель реализует синтез и взаимодействие познавательных процедур, образующих автоматизированное рассуждение, областью применимости которого является класс задач, решаемых посредством формализованной эвристики. Логическим средством формализации этой эвристики и являются рассуждения.

Существуют два типа Рассуждателей. Рассуждатели 1-го типа применимы к неизменяющемуся множеству исходных высказываний, характеризующих «замкнутый мир»), а их логическим средством являются дедуктивные выводы (возможны варианты, когда используются неклассические логики).

Рассуждатели второго типа реализуют формализованные эвристики для решения классов задач, исходными данными которых являются изменяемые и пополняемые множества высказываний (под изменением высказываний мы понимаем пересмотр его истинностного значения, соответствующие базы фактов будем называть эпистемическими). Формализованные эвристики этого типа осуществляют синтез познавательных процедур, включающих эмпирическую индукцию, основанную на установлении сходства фактов, и абдукцию, посредством которой объясняется начальное состояние базы фактов и, в случае необходимости, реализуется ее пополнение (это означает, что Рассуждатели второго типа применимы к «открытым мирам»).

Примером Рассуждателей второго типа являются Рассуждатели интеллектуальных систем, реализующие правдоподобные ДСМ-рассуждения, которые образуют синтез трех познавательных процедур – эмпирической индукции, аналогии и абдукции. Причем в ДСМ-рассуждениях используется особый вид индукции – уточнения т.н. индуктивных методов Д.С. Милля, существенным образом отличающиеся от перечислительной индукции.

Рассуждатель второго типа (Рассуждатель-2) является средством приближенного выполнения некоторых существенных способностей, образующих идеальный тип феномена «интеллект» (в т.ч. (3), (4), (5), (6), (8), (9), (10), (13)). В силу того, что рассуждения, которые осуществляет Рассуждатель-2, доставляют новые знания, эти рассуждения можно назвать когнитивными (правдоподобными) рассуждениями (СР-рассуждениями).

Общей характеристикой СР-рассуждений является их недедуктивный характер: из истинности посылок не вытекает истинность следствия, следствие является лишь правдоподобным высказыванием, а, следовательно, и сами СР-рассуждения являются правдоподобными рассуждениями в смысле Д. Пойа [1]. СР-рассуждения содержат амплиативные выводы (термин Ч.С. Пирса), следствия которых есть результат некоторой догадки, оформленной в виде некоторого правила. Примерами таких выводов являются выводы с использованием индукции, порождающие обобщения на основе установленного сходства фактов, аналогия и абдукция. Таким образом, СР-рассуждения являются средством порождения гипотез и получения нового знания с использованием фонового знания (быть может, содержащего массив фактов, в ИС – это база фактов (БФ)).

СР-рассуждения подразделяются на три подкласса: вероятностные (например, использующие байесовские правила); приближенные (например, использующие аппарат нечетких множеств); правдоподобные рассуждения, являющиеся организацией различных взаимодействующих познавательных процедур.

Сформулируем теперь некоторый подкласс СР-рассуждений, который будем называть когнитивными правдоподобными эмпирическими рассуждениями (СРЕ –рассуждения), характеризуемый утверждениями А1-А9.

А1. Знания, используемые в СРЕ-рассуждениях, должны некоторым образом соответствовать типам предметных областей (b) и (с), содержащих зависимости причинно-следственного типа (детерминациям изучаемых эффектов).

А2. Знания, используемые в СРЕ-рассуждениях, являются открытым множеством высказываний (в ИС, реализующих СРЕ-рассуждения, БЗ является открытой). Это знание пополняется в соответствии с некоторым критерием, контролирующим принятие гипотез, полученных посредством амплиативных выводов. В силу этого СРЕ-рассуждения фактически являются немонотонными: добавление нового знания (высказываний в БФ) может изменить оценки высказываний, представляющих факты из начального состояния знаний информационной среды.

А3. СРЕ-рассуждение является синтезом некоторых познавательных процедур, включающих индукцию. Индукция используется для сравнения фактов и порождения гипотез о причинно-следственных зависимостях. Эти зависимости в ИС в неявном виде содержатся в БФ. Таким синтезом, например, может быть взаимодействие индукции, аналогии и абдукции.

А4. Индуктивные процедуры, реализующие идею индукции, представимы в виде специальных амплиативных правил, отличных от перечислительной индукции.

А5. При формализации СРЕ-рассуждений используется неклассическая концепция истины такая, что:
  1. различаются оценки фактов, гипотез и металогических утверждений о них [2];
  2. оценки гипотез есть некоторые степени правдоподобия, эффективно порождаемые посредством амплиативных правил;
  3. метаутверждения имеют истинностные значения «истина» или «ложь» двузначной логики.

А6. Правила амплиативных выводов формулируются в аргументативном языке [3] так, что порождаемые гипотезы проверяются на наличие аргументов за их принятие и аргументов против их принятия (контраргументов).

А7. Утверждение А6 предполагает, что в «мирах» типа (b) или (с) существуют как положительные примеры (факты) исследуемого эффекта ((+)-примеры), так и отрицательные примеры (()-примеры), а порожденные гипотезы о зависимостях причинно-следственного типа являются аргументами или контраргументами для предсказания наличия или отсутствия изучаемого эффекта у соответствующих объектов. Это означает, что в процессе реализации СРЕ-рассуждений автоматически порождаются фальсификаторы гипотез.

А8. Исходными данными СРЕ-рассуждений (начальными состояниями БФ) являются множества высказываний, представляющих факты, т.е. результаты эмпирического исследования (например, описания экспериментов). Эти факты содержат объекты со сложной структурой (множества, кортежи, графы, системы отношений и т.п.), характеризуемой качественными параметрами. Отсюда вытекает невозможность манипулирования (в том числе – установления сходства) этими фактами в реальное время без применения ИС.

А9. Исходные данные СРЕ-рассуждений (т.е. начальные состояния БФ) расширяются в зависимости от полученных результатов и выполнимости критерия принятия гипотез (в соответствии с А2). Это расширение БФ является динамическим формированием БФ достаточно информативной для того, чтобы порожденные гипотезы объяснили начальное состояние БФ и были приняты.

Утверждения А1 – А9 определяют класс формализованных эвристик, реализуемых посредством СРЕ-рассуждений, которые содержат индуктивные процедуры. Эти индуктивные процедуры основаны на установлении сходства фактов, имеющих осмысленную интерпретацию.

Применение Рассуждателем СРЕ-рассуждений обеспечивает порождение новых знаний посредством ИС в соответствии со схемой познавательного процесса эволюционной эпистемологии 4: Р1 ТТ  ЕЕ Р2, где Р1 – рассматриваемая проблема (класс задач), ТТ – пробная теория (допускающая расширение и коррекцию), ЕЕ – коррекция ТТ, Р2 – формулировка новой проблемы в соответствии с анализом полученных результатов посредством ИС.

Примером интеллектуальной системы высокого уровня являются системы, реализующие ДСМ-метод автоматического порождения гипотез (ДСМ-метод АПГ 5). ДСМ-метод АПГ состоит из: характеризации условий применимости, теории правдоподобных ДСМ-рассуждений, включающей их дедуктивную имитацию, квазиаксиоматических теорий как средств представления знаний в ИС для открытых предметных областей.

ДСМ-рассуждения, реализуемые Рассуждателем ИС, являются синтезом и взаимодействием трех познавательных процедур: эмпирической индукции, каузальной аналогии и конструктивной абдукции. Условия же применимости ДСМ-рассуждений неформально характеризуются следующими требованиями: данные, представленные в БФ, должны быть хорошо структурированы (что означает, что сходство объектов должно быть алгоритмически определено); знания о предметной области W должны быть представимы в виде квазиаксиоматической теории (аксиомы, частично характеризующие W, открытое множество фактов и гипотез и правила вывода, содержащие правила правдоподобного вывода для индукции и аналогии); в БФ должны быть представлены как позитивные, так и негативные факты (соответственно: ()- примеры изучаемого эффекта), а также примеры неопределенности (-факты), относительно которых должно быть сделано предсказание (т.е. порождена ()-гипотеза, или ()-гипотеза, т.е. установлена неопределенность и на следующих шагах рассуждений); далее, в БФ в неявном виде должны содержаться как позитивные, так и негативные зависимости причинно-следственного типа (они будут выявлены как гипотезы о ()-причинах).

Правила правдоподобного вывода 1-го рода (п.п.в.-1) ДСМ-рассуждений формализуют не прямую, контекстно-зависимую миллевскую индукцию (она, следовательно, является не перечислительной), удовлетворяющую принципу: сходство объектов детерминирует повторяемость эффектов, а не наоборот.

П.п.в.-1 формулируются посредством предикатов сходства объектов M+(V,W) и M(V,W), заданных на множествах (+)-фактов и ()-фактов соответственно. БФ образована отношением «объект обладает множеством свойств». П.п.в.-1 имеют четыре типа правил, соответствующие логически возможным комбинациям М-предикатов: М+М, М+М, М+М и М+М, которые являются посылками правил. Следствием этих правил являются гипотезы, имеющие истинностные значения вида = ,n, где    ,  – тип истинностного значения, n – номер шага применения п.п.в., а     – фактические истина, ложь, противоречие и неопределенность, соответствующие комбинациям М-предикатов в посылках. Эти истинностные значения приписываются высказываниям «подобъект С есть причина эффекта Q», где Q – множество свойств, а эти высказывания представляют частично-определенное отношение «подобъект есть причина множества свойств».

Отметим следующие важные обстоятельства:
  1. истинностное значение порожденной гипотезы определено конструктивно (n – степень правдоподобия гипотезы),
  2. посредством БФ и п.п.в.-1 порождено отношение «причина», которое является новым знанием и принадлежит БЗ,
  3. М+ и М являются взаимно фальсифицирующими условиями, а комбинация М+М порождает фактическое противоречие (фальсификатор, используемый в процессе порождения гипотез).

П.п.в.-2 формализуют выводы по аналогии: посредством этих правил, использующих гипотезы о причинах (результаты применения п.п.в.-1), осуществляются предсказания для случаев неопределенности «объект С имеет множество свойств Q». Если С покрывается множеством Сi, i =1, ..., k, таких, что СiС, Сi есть (+)-причина Qi (на n-ом шаге), и , но ()-причины (для Qi) не содержатся в С, то порождается (+)-гипотеза: высказывание «объект С есть причина наличия множества свойств Q» имеет истинностное значение 1, n+1. Аналогично порождаются гипотезы с оценками   . Отметим, что эта гипотеза аналогична высказываниям, порожденным на шагах m<n, или принадлежащих БФ. Гипотезы этого рода (как результат п.п.в.-2) также принадлежат БЗ, образуя ее фрагмент, содержащий новое знание.

ДСМ-рассуждение состоит из последовательного применения (п.п.в.-1) + (п.п.в.-2) до стабилизации множества порождаемых гипотез. Этот этап ДСМ-рассуждения образует цикл применения двух познавательных процедур – индукции и аналогии.

Вторым этапом ДСМ-рассуждения является абдуктивное объяснение начального состояния БФ, т.е. принятие порожденных гипотез первого и второго рода посредством абдукции. Квазиаксиоматическая теория предметной области W, удовлетворяющая условиям применимости ДСМ-метода АПГ, содержит аксиомы каузальной полноты АКП(+) и АКП(). Смысл АКП(+) состоит в характеризации «мира» типа (b) следующим образом: для каждого (+)-факта «объект С обладает множеством свойств Q» из начального состояния БФ существуют (+)-причина Q такая, что СС. Аналогично формулируется АКП().

АКП() является критерием достаточного основания для принятия гипотез. Если АКП() выполняется для БФ, то порожденные гипотезы принимаются на достаточном основании. В противном случае БФ расширяется для всех тех фактов, которые не объясняются, что означает, что АКП() ложно относительно соответствующих пар С, Q, где С – объект, а Q – множество его свойств. После расширения БФ ДСМ-рассуждение продолжается. ДСМ-рассуждение завершается, если имеют место три возможные исхода: (1) АКП() выполняются – гипотезы принимаются на достаточном основании; (2) после серии расширений БФ остается незначительная область необъясненных фактов – гипотезы принимаются на квазидостаточном основании; (3) АКП() не выполняются и при этом возникают вновь необъясненные факты – гипотезы не принимаются.

Из описания ДСМ-рассуждения вытекает, что оно является немонотонным рассуждением, применяемым к открытым «мирам» типа (b). Очевидно также, что ДСМ-рассуждение является СРЕ-рассуждением, которое и является примером механизма ИИ, аппроксимирующим способности идеального типа интеллекта (1) – (13).

Важным свойством ИС высокого уровня является инвариантность логических средств Рассуждателя относительно изменений структур данных в БФ и БЗ. Это обстоятельство существенно для определения сходства объектов в БФ и порождения гипотез о зависимостях, извлекаемых из БФ. Примером такой инвариантности являются ИС типа ДСМ: в них варьируются структура данных (т.е. определения термов), примерами которой являются структуры данных с объектами, представленными множествами (булевская структура), кортежами, графами, пространственными графами.

Второй важной особенностью ИС, аппроксимирующих интеллектуальную деятельность, является варьирование предметных областей определенного типа (т.е. (а), (b) или (с)) при сохранении структуры Рассуждателя как «ядра» Решателя задач. Примером таких систем являются ИС типа ДСМ, которые применялись и применяются для задач фармакологии и биохимии, медицинской диагностики, технической диагностики и для задач анализа и прогнозирования социального поведения 6, 7.

Эти особенности ИС как компьютерных систем обработки фактов и использования знаний для получения новых знаний (knowledge discovery) означают, что они являются средством продолжения интеллектуальной деятельности (научное исследование, управление, обработка больших массивов клинических данных, анализ прецедентов для юридических проблем и т.п.), неосуществимой (в реальное время) человеком.

Здесь следует однако отметить, что ИС, обладающие Рассуждателем, реализующим СРЕ-рассуждения, не только способны имитировать интеллектуальную деятельность, но и усиливать ее посредством специфических логических инструментов, образующих стратегии решения задач, которые выбирает синтезатор (подсистема Решателя) на основе обзора и анализа результатов работы ИС (в схеме эволюционной эпистемологии – это переход к новой проблеме Р2).

ИС высокого уровня должны обладать средствами дедуктивной имитации СРЕ-рассуждений, что создает возможность планировать на логическом уровне новые версии ИС (для новых проблем или новых средств их решения). Но это означает, что создается возможность развития серии ИС, адекватных изучаемым «мирам».

Принцип адекватности Рассуждателя «мирам» (т.е. предметным областям), к которым он применяется, существенен для «миров» типа (a), (b) и (c). Отметим при этом, что соответствие ДСМ-рассуждений «мирам» типа (b) может быть обосновано на логическом уровне. Это соответствие осуществляется посредством проверки АКП(), выражающих условие абдуктивного объяснения БФ 8. Если начальное состояние БФ удовлетворяет условиям применимости ДСМ-рассуждений 8, то и заключительное состояние измененной БФ удовлетворяет этим условиям (принцип адекватности W типа (b) и ДСМ-метода автоматического порождения гипотез). В случае невыполнимости АКП() БФ расширяется относительно всех фактов таких, что они не имеют абдуктивного объяснения в соответствии с АКП(), а процесс ДСМ-рассуждений повторяется.

Из сказанного вытекает, что ИС высокого уровня, реализующие СРЕ-рассуждения (возможный механизм ИИ) являются некоторым ответом на проблемы, поставленные известным японским проектом компьютеров 5-го поколения 9. А именно: СРЕ-рассуждения в ИС являются конкретным средством реализации метавыводов 9, образованных объединением индукции и аналогии (добавим к этому и абдукцию).


Литература
  1. Пойа Д. Математика и правдоподобные рассуждения. М: Наука, 1975.
  2. Бочвар Д.А. Об одном трехзначном исчислении и его применении к анализу парадоксов классического расширенного функционального исчисления / Математический сборник. 1938. Т.4, вып. 2, с. 287-308.
  3. Поппер К.Р. Призыв Бернайса к более широкому пониманию рациональности. В кн.: Эволюционная эпистемология и логика социальных наук. УРСС. М: 2000. с. 163-175.
  4. Поппер К.Р. Объективное знание. М: УРСС. 2002.
  5. Финн В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ. Итоги науки и техники. Информатика. Т. 15. М: 1991. с.54-101.
  6. Забежайло М.И. Формальные модели рассуждений в принятии решений: приложения ДСМ-метода в системах интеллектуального управления и автоматизации научных исследований. НТИ. Сер. 2. 1996. №5-6. с. 20-33.
  7. Финн В.К., Михеенкова М.А., Бурковская Ж.И. Об интеллектуальной системе для анализа электорального поведенияю Тезисы докладов настоящей конференции.
  8. Финн В.К. Синтез познавательных процедур и проблема индукции // НТИ. Сер. 2. № 1 – 2. 1999. с. 8 – 45.
  9. Симонс Дж. ЭВМ пятого поколения: компьютеры 90-х годов. Финансы и статистика. М: 1985.