Вопросы философии №1, 2005 г

Вид материалаДокументы

Содержание


1. От натурфилософии к анализу категориальной системы мышления.
2. От содержательного анализа к логической реконструкции.
3. От логико-философских штудий к информационным технологиям
5. Онтология в фундаментальной физике
Подобный материал:
  1   2   3




Вопросы философии № 1, 2005 г.


ОНТОЛОГИЯ: ОТ НАТУРФИЛОСОФИИ К НАУЧНОМУ МИРОВОЗЗРЕНИЮ

И ИНЖЕНЕРИИ ЗНАНИЙ*


Рубашкин В. Ш.

vrub@mail.nw.ru

Лахути Д. Г.

delir1@yandex.ru


Рассматривается содержание и использование термина «онтология» в связи с проблемами, актуальными в современной науке. Кратко рассматривается эволюция понимания термина в философии Нового времени. Вторая часть статьи посвящена новому использованию термина в сфере интеллектуальных информационных технологий и инженерии знаний, где термин «онтология» обозначает детально описанную и полностью формализованную модель понятийной системы предметной области. В этом новом качестве термин стимулировал формирование нового научного направления под тем же названием.

В последней части показано, что наряду с этим актуальным остается и понимание онтологии как систематизированного научного мировоззрения. Логическая рефлексия по поводу онтологических допущений, принимаемых в процессе конструирования научной теории, не заменяет и не отменяет их использования в процессе теоретического мышления. На примере познавательной ситуации в фундаментальной физике иллюстрируются те полностью пока не используемые возможности, которые такое использование может предоставить.


Язык науки, как и все иные сферы человеческого бытия, подвержен приливам и отливам моды. Не всегда легко объяснить мотивы, по которым полузабытые или вновь изобретенные термины вдруг становятся модными, а иногда превращаются в нечто вроде ничего уже не означающего универсального междометия, без которого любой имитатор научной работы просто не может обойтись – поскольку именно они, эти междометия, как он полагает, и символизируют принадлежность к профессиональному сообществу. В свое время эту судьбу разделили, например, такие почтенные термины как кибернетика, моделирование, системный подход; теперь другие времена, но примеры, разумеется, легко можно продолжить… В последние годы мы наблюдаем второе рождение почти забытого и, казалось бы, навсегда оставленного истории философии1 термина "онтология". В начале 90-х термин этот совершенно неожиданно появился в сфере инженерии знаний и быстро приобрел популярность. Контексты его употребления, на первый взгляд, имеют мало общего со старой философской традицией; это дает основание для постановки ряда вопросов. Сохраняется ли преемственность – есть ли что-то существенно общее у старого философского термина и его сегодняшнего употребления? С чем в этом случае мы имеем дело – с гримасой моды или с выработанным развитием науки новым содержанием? И – если ответ на предыдущий вопрос будет положителен - какое, собственно, точное содержание приписывается этому термину в его новой жизни? И еще. Осталось ли все-таки в философии – в ее современном понимании – место для такого раздела как "Онтология?". В настоящей статье авторы, профессиональная судьба которых сложилась так, что им пришлось иметь дело и с методологией науки, и с практикой исследований и разработок в области интеллектуальных систем, предпринимают попытку дать свой ответ на эти вопросы.


1. От натурфилософии к анализу категориальной системы мышления.

"Онтологией" принято называть "учение о бытии как таковом" (совокупность "всеобщих законов бытия"). Онтологические утверждения – в отличие от законов положительных наук – суть утверждения о предметах вообще, о состояниях и событиях вообще, в то время как законы, формулируемые положительной наукой, стремятся выявить специфику предметов и явлений какого-то определенного класса. Мы не ставим своей целью еще раз углубляться в много раз уже представленную историю возникновения и развития самого термина. Важна определяющая тенденция философии Нового Времени – движение мысли от конструирования натурфилософской картины мира, от умозрительного уяснения "истинной природы вещей" к анализу категориальной природы мышления и его познавательных способностей. Решающий шаг в этом направлении сделал Кант, само философское творчество которого представляет собой движение от "всеобщей естественной истории и теории" к "критике чистого разума". Гегель в определенном смысле завершил, во всяком случае, довел до логического конца идею такого переосмысления онтологии, оформив это переосмысление во внешне парадоксальном тезисе о тождестве бытия и мышления. Человеческий мир есть мир, определяемый и описываемый через систему всеобщих категорий бытия, он (в определенном смысле) и есть само это описание. Вместе с тем, другая часть правды состоит в том, что Гегель завел философскую мысль в тупик чисто спекулятивного мышления. Восстановление связей философии с традициями научного мышления произошло лишь в первой половине XX века и связано с совершенно иной научной и философской традицией.


2. От содержательного анализа к логической реконструкции.

В первой половине XX века фокус философской мысли – в том, что касается философии природы и философии науки - переместился от обсуждения "последних начал бытия" и общих проблем теории познания к исследованию языка науки. Этот интерес стимулировался, с одной стороны, успехами физических наук и математики, с другой – фактом создания (и широкого признания) первого в истории науки универсального языка представления знаний, опирающегося на точный и доступный математическому анализу синтаксис, – языка символической логики. "То, что вообще может быть сказано, может быть сказано ясно…" Под знаком этого знаменитого афоризма Л. Витгенштейна проходит весь этот период. Язык спекулятивной философии – в тех случаях, когда им явно злоупотребляют – не может не вызвать к себе критического отношения.2 Меняется сам предмет философского знания; соответственно, меняются и критерии принятия тех или иных философских положений. Суть нового взгляда на философию сводилась, в частности, к тому, что "онтологические" утверждения, которые, по внешней своей форме, выглядят как утверждения о законах материального мира, следует интерпретировать как утверждения, определяющие и уточняющие смысл используемых в "положительных" науках терминов, т. е. как утверждения метаязыкового уровня. Возможность такой интерпретации онтологических утверждений (в терминах Р. Карнапа – "перевод в формальный модус") и есть критерий их осмысленности. Проиллюстрируем этот подход небольшим примером, ориентируясь уже на современное понимание методов использования языка логики для формализации смысла понятий и принципов науки.

Одним из "краеугольных камней" диалектического материализма, известных до недавнего времени каждому аспиранту и студенту, был тезис пространство и время суть формы существования материи. Этот тезис конкретизировался рядом совершенно справедливых положений: "предельно общие свойства, выражающие структурную организацию материального мира, - свойства объектов быть протяженными, занимать место среди других, граничить с другими объектами – выступают как первые, наиболее общие характеристики пространства".3 Эта апелляция к здравому смыслу в большинстве случаев вполне достаточна. Дальнейший анализ оказывается необходим тогда, когда начинают формулироваться "безумные идеи", призывающие тем или иным способом пересмотреть понятия пространства и времени. Сюда можно отнести тезисы о "дискретности пространства", "кривизне пространства", эмпирическом существовании многомерных пространств, обращении времени вспять, передаче сообщений через четвертое измерение и прочих поражающих воображение вещах. Каждый раз при этом у непредубежденного читателя возникает естественное желание понять, о чем идет речь – о революционном пересмотре основополагающих принципов науки или просто о неправильном и неадекватном употреблении терминов. И здесь уже требуется предельная точность в определении того, что мы имеем в виду, говоря о существовании в пространстве и времени. Без символического языка, позволяющего, по крайней мере, точно зафиксировать структуру и смысл соответствующих утверждений, здесь никак не обойтись. И тогда мы можем получить, например, следующее. Одной из основных пространственных характеристик является расстояние. "Занимать место среди других" и означает, прежде всего, находиться на определенных расстояниях от других объектов. Категория протяженности (линейный размер) также вполне очевидным образом связана с понятием расстояния. Эмпирическая трехмерность пространства тоже может быть связана с понятием расстояния: положение объекта среди других тел однозначно определяется его расстояниями до трех других объектов, не находящихся в одной плоскости. Что же мы имеем в виду, какие очевидные (а иногда и не осознаваемые) - и потому обычно не вербализуемые в утверждениях о расстоянии между объектами - предпосылки скрыты в утверждении Расстояние между предметами x и y равно v? Только аккуратно зафиксировав все эти предпосылки, можно сделать членораздельным и ясным отказ от тех или иных "классических" концепций пространства и времени. В данном примере это может выглядеть следующим образом. Во-первых, расстояние есть некоторая измеряемая, представимая в числовой форме характеристика. И первое, что следует констатировать, - это обязательное существование измерительной процедуры (теста), позволяющей получить числовое значение v для любой заданной пары объектов x и y в универсуме, характеризуемом этим признаком. Расстояние, прежде всего, и есть имя этого теста. Для той совокупности объектов, к которой тест применим, он должен удовлетворять требованиям воспроизводимости и универсальности.4 Говоря о расстоянии, мы принимаем две обязательные логические посылки. Первая: несовместимость значений - невозможность одновременного приписывания двух разных значений расстоянию между данными объектами в данный момент времени. Вторая: обязательность получения какого-то определенного результата при измерении расстояния между любыми объектами рассматриваемого универсума. Используя общепринятую логическую символику, точный смысл названных предпосылок может быть представлен следующим образом:


(1) "x"y"t "v1"v2 (РАССТОЯНИЕ (x, y, t, v1 ) & v2 v1) à

~ РАССТОЯНИЕ (x, y, t, v2)

(2) " x " y " t ( O1(x, t) & O2(y, t) ) à $ v РАССТОЯНИЕ (x, y, t, v) ),

где запись РАССТОЯНИЕ (x, y, t, v ) следует читать как расстояние между объектами x и y в момент времени t равно v. Во второй формуле O1(x, t) и O2(y, t) следует понимать как некоторые описания объекта 1 и объекта 2, справедливые в момент времени t и достаточные для однозначного их выделения из совокупности непосредственно или опосредованно наблюдаемых предметов и явлений. Смысл этих двух формул можно передать следующими словами: если объекты O1 и O2 можно выделить и различить, то к ним безусловно применима процедура измерения расстояния, и она должна дать определенный и единственный результат.

И то, что здесь утверждается, вовсе не утверждения о мире, которые, в свою очередь, требовали бы опытной проверки; они суть утверждения о том, как мы хотим понимать и употреблять термин расстояние; это то, что Р. Карнап назвал постулатами значения. Если Вы хотите осмысленно употреблять фразу пространство – форма существования материи, Вы должны быть готовы предъявить описание измерительных процедур и совокупность постулатов значения, подобных (1) и (2), для всего того в языке, что Вы определяете как пространственные характеристики: расстояние, форма, протяженность, либо что-то еще. Если Вы не готовы осуществить такую конкретизацию, исходное утверждение следует признать бессмысленным (а не ложным!) во всяком случае, в рамках парадигмы «положительной», или эмпирической, науки. Такова, по существу, позиция Р. Карнапа, и нет оснований с ней не согласиться. В отношении "безумных идей" к сказанному выше нужно добавить следующее. Если Вы говорите о неприменимости обычных пространственных представлений в микромире или где-нибудь еще, Вы должны быть готовы предъявить свои версии определения измерительных процедур и/или свои версии постулатов значения для тех же терминов – иначе то, чем Вы занимаетесь, должно быть выведено за пределы эмпирической науки.


3. От логико-философских штудий к информационным технологиям:

формальные онтологии предметной области.

Развитие информационных технологий привело к созданию класса систем, которые получили общее наименование "системы, основанные на знаниях". Функционально они ориентированы на те же задачи, которые входят в набор стандартных информационных технологий: информационный поиск, системы поддержки принятия решений, системы автоматизации проектирования, автоматический перевод и др. Речь идет о способах и средствах интеллектуализации таких систем, перевода их на качественно новый уровень. Базы знаний, предназначенные для поддержки такого рода систем и обеспечивающие формализованное описание предметной области, определяемой конкретной инженерной задачей, начали создаваться (в основном в США) практически одновременно и независимо целым рядом исследовательских групп с конца 1980-х г.г.5 Осмысление полученных результатов сделало очевидным возникшую проблему: базы знаний, построенные разными способами, основанные на разных исходных допущениях, использующие разные языки представления знаний, реализующие разные наборы отношений между понятиями и разные программные средства управления знаниями, оказываются трудно сопоставимыми и непригодными для многократного использования в разных задачах. Независимо от того, какие средства и методы используются для формализации знаний и работы со знаниями, обязательной предпосылкой любой состоятельной формализации знаний должна быть детально описанная формализованная модель понятийной системы предметной области. Возникла необходимость как-то именовать эту конструкцию. В 1991 г. сотрудник Станфордского университета Том Грубер (T. R. Gruber) предложил использовать для этой цели термин онтология.6 Сам Грубер кратко определил его как спецификация концептуализации (specification of a conceptualization) и первоначально связывал его прежде всего с проблемой создания открытого для общего и многократного использования (sharable and reusable) информационного ресурса; одновременно подчеркивалась аналогия с понятийным словарем. Объективно новый термин должен был зафиксировать по крайней мере два противопоставления. Во-первых, противопоставить предполагаемую инженерную конструкцию лингвистическим толковым словарям, которые инвентаризуют значения слов и выражений, но совершенно не касаются системы используемых понятий. Во-вторых, отграничить ее от традиционных энциклопедических словарей, которые содержательно описывают понятия некоторой предметной области, но не систематизируют их и заведомо не претендуют на какую бы то ни было формализацию представляемых понятийных систем.

Использование термина онтология в этом качестве в определенной мере можно считать случайным. Окажись на месте Грубера другой специалист, он, возможно, предложил бы на эту роль другой термин – например, принятый в информатике термин тезаурус. Однако последний уже был связан с определенной методологией формализации понятийных систем, которая для систем, основанных на знаниях, представлялась недостаточной.7 Термин онтология, взятый из другой области, не имел нежелательных коннотаций; с другой стороны, для тех, кто владеет его философским содержанием и его историей, он мог привнести именно те аспекты содержания, которые вполне релевантны его новому употреблению: во-первых, логически систематизированное описание действительности, во-вторых, – учитывая его позднейшую эволюцию в русле логического эмпиризма – логическую формализацию. Самое существенное отличие его нового употребления от прежнего философского состоит в том, что теперь речь идет не только о логической систематизации и логическом анализе всеобщих определений бытия (хотя и об этом тоже), но и о таком же анализе конкретных понятийных систем. Фактически это употребление термина онтология приближает его к понятию концептуальная модель предметной области. Имея все это в виду, можно говорить о расширении традиционного содержания термина. Вместе с тем становится обязательным тот аспект содержания, который указывает на формализацию и оформление модели в виде доступного для многократного использования вычислительного ресурса. И с этой точки зрения можно говорить, наоборот, о сужении традиционного содержания. Поэтому, возможно, более адекватным будет выражение инженерная онтология, либо компьютерная онтология.

Буквально за несколько лет термин стал весьма популярным в среде специалистов по интеллектуальным системам и инженерии знаний. Фактически он стимулировал формирование нового научного направления под тем же названием. Появились научные коллективы и объединения, профессионально отождествляющие себя с этим термином. Появилась масса сетевых и обычных публикаций как по общим вопросам концептуального моделирования, так и с описанием результатов логической реконструкции самых разных понятийных систем – от техники и географии до биологии и медицины8, и теперь, наверное, ни одна уважающая себя научная конференция, затрагивающая проблемы инженерии знаний, не обходится без раздела с этим названием.

При всех различиях и оттенках в "инженерной" трактовке термина онтология можно констатировать, что речь идет, как минимум, о следующих вещах: 9
  1. отбор релевантных для рассматриваемой предметной области понятий – экспертом предметной области и/или отправляясь от представительного корпуса текстов;
  2. категоризация (начальная классификация) отобранных понятий;
  3. дальнейшая внутрикатегорная систематизация - таксономическая (иерархическая) организация понятийного словаря;
  4. установление отношений между понятиями в рамках некоторого априори принимаемого ограниченного списка значимых отношений (обычно используются не зависящие от выбора предметной области универсальные отношения – часть-целое, принадлежать к совокупности, быть связанным с, иметь местом, и т. п.; могут использоваться и более конкретные, специфичные для данной предметной области отношения.

Дальнейшая разработка концептуальной модели может предусматривать формулировку постулатов значений для всех или некоторых понятий и, далее, формулировку содержательных аксиом, устанавливающих логические или даже количественные зависимости между значениями атрибутов, характеризующих объекты предметной области. Но этот последний шаг принципиальным образом переводит всю работу из области логической реконструкции языка в область описания (теоретического исследования) действительности. В этом случае создаваемую конструкцию привычнее и правильнее будет называть уже не онтологией, а теорией – в обычном и общепринятом смысле этого термина.

Нужно отметить, что так понимаемое концептуальное моделирование в информационных технологиях возникло не на пустом месте. Его предшественниками можно считать, с одной стороны, хорошо известную, воспринимаемую как стандарт де-факто, методологию проектирования реляционных баз данных и, с другой стороны, сложившуюся практику построения информационно-поисковых тезаурусов для документальных информационно-поисковых систем. В первом случае характерными операциями является типизация объектов, определение набора атрибутов для каждого типа объектов, учет функциональных зависимостей между атрибутами, установление неспецифицированных отношений между объектами разных типов (определение схемы базы данных). Во втором случае характерными операциями следует считать инвентаризацию и категоризацию понятий, построение таксономических рядов и установление других смысловых связей между понятиями.

Методологию "онтологического" конструирования пока нельзя считать вполне завершенной. Отметим некоторые проблемные пункты. (1) Хотя практически общепризнанно, что инженерная онтология должна формулироваться в языке логического типа, пока в профессиональном сообществе не достигнуто согласия относительно конкретных спецификаций, унифицирующих использование такого языка. Существует ряд проектов таких спецификаций, но ни одну из них нельзя считать прочно утвердившейся и принятой профессиональным сообществом. (2) Таксономические системы обычно строятся без учета необходимости формализовать полный набор объемных отношений между понятиями, – т. е. учитывать не только отношение включения (общее - частное), но и отношения совместимости – несовместимости, которые в традиционных иерархических системах вообще не различаются. Иными словами, понятийные модели не улавливают разницы между отношением, скажем, понятий лев и охотник, с одной стороны, и охотник и бизнесмен, с другой. Для задачи автоматического анализа смысла текста такое различение весьма существенно.10 (3) При построении онтологий конкретных предметных областей не рассматривается систематически вопрос о семантических примитивах предметной области. В результате разработчик концептуальной модели сталкивается с трудностями, которые обычно обнаруживаются в процессе построения таксономических схем. В них рано или поздно обнаруживаются пробелы и факты логической непоследовательности. Поэтому в технологии концептуального моделирования должен быть предусмотрен принципиально важный этап – выявление и фиксация системы семантических примитивов предметной области (мы называем их "базовыми признаками"). Они организуются в иерархическую систему специального вида – "дерево признаков"; в ней естественным образом – через механизм наследования свойств - определяется полная система объемных отношений. Все прочие термины предметной области должны быть определены через базовые признаки. Прямое определение состоит в сопоставлении термину формального толкования; вычислительная функциональность модели должна обеспечивать логическую обработку построенных толкований. Для терминов-предикатов, если они включаются в состав модели, базовые признаки используются в их определении косвенно - как определители условий заполнения валентностей.11

Здесь следует обратить внимание на то, что вместо одной онтологии, онтологии единого и единственного мира, как в классической философии, мы теперь говорим о разных онтологиях, онтологиях разных предметных областей или миров (миры у нас теперь стали "маленькими" или, точнее, локальными). Эта "локализация" онтологий имеет свою положительную сторону: локальные онтологии легче формализовать, легче обеспечить их полноту (относительно выбранной предметной области и решаемого круга задач!) и непротиворечивость – потому-то, собственно, эта тенденция и возникла. Но у нее есть и отрицательная сторона – отсутствие в общем случае совместимости между разными онтологиями. На сегодняшний день фактом является то, что представления знаний в разных областях плохо совместимы между собой – даже для таких простых типов знания, как классификаторы, рубрикаторы и пр.12

Отсюда возникает, говоря философским языком, проблема единства знания. На языке инженерных онтологий ей соответствует задача создания единой базовой онтологии, обеспечивающей совместимость частных, локальных онтологий. В упомянутых выше (см. примечание 11) работах авторов намечается возможный подход к созданию такой онтологии.