Законы существования текстов в обществе 32

Вид материалаЗакон
Часть 2. УПРАВЛЕНИЕ ЗНАНИЯМИ Глава 1. Основные понятия
Понятие знания
Локализация знания
Элементарный акт обработки знания. Критерий существования знания
Источники знаний
Понятие предметной области (knowledge domain)
Диалектика соотношения «знания–информация–данные»
Новый тривиум
Подобный материал:
1   ...   5   6   7   8   9   10   11   12   ...   22

Часть 2. УПРАВЛЕНИЕ ЗНАНИЯМИ

Глава 1. Основные понятия


Сейчас все чаще употребляется термин управление знаниями. Однако употребляется этот термин часто неоднозначно и по-разному. Начнем с определений.

«Под управлением знаниями в общем случае понимается дисциплина, которая обеспечивает интегрированный подход к созданию, сбору, организации, доступу и использованию информационных ресурсов организации. Эти ресурсы включают в себя корпоративные базы данных, текстовую информацию, такую, как документы, описывающие правила и процедуры, и, что наиболее важно, неявные знания и опыт сотрудников организации» [10].

Это довольно авторитетное определение международной фирмы IBM. Согласно этому определению видно, что управление знаниями есть достаточно сложная и совершенная система управления информацией. Об этом же говорит и другое определение, приводимое ниже.

«Под корпоративными знаниями понимается различная деловая информация, которую необходимо иметь для поддержки на высоком уровне основных бизнес-процессов предприятия, а также для быстрого реагирования на динамику рынка. В более широком смысле знания – это информация, материализованная в процессе решения конкретной задачи в виде каких-то конкретных действий людей, стремящихся достичь своих конкретных целей» [10].

Рассмотрим другие определения.

«При внедрении технологий управления знаниями особое внимание мы уделяем стратегии создания и развития хранилищ корпоративных данных, которую мы увязываем со стратегическими аспектами развития всей компании и потребностями конкретных бизнес-процессов» [3].

Согласно этому определению получается, что управление знаниями есть достаточно сложная и совершенная система управления данными.

На самом деле противоречия в этих определениях нет. Во-первых, во многих англоязычных публикациях специально отмечают, что knowledge management – это единый термин, определяющий определенного уровня сложности кибернетическую программную систему. И это не есть management of knowledge.

Понятие знания


Из вышеизложенного видно, что понятие знания относится к числу так называемых трудно формализуемых понятий. К тому же этот термин часто заменяется близкими понятиями информации и данных. Тем не менее, до сих пор не прекращаются попытки разобраться, в чем разница между тремя понятиями – данные, информация и знания [2].
А вопрос об этом концептуально очень важен. Как отмечается многими авторами, проблема заключается в том, что знание, как и другие базисные философские категории, довольно трудно описать и определить прямым образом, по образу и подобию понятия предел последовательности. В данном случае категория знание (как и множество) можно считать базисным и не определяемым.

Например, рассмотрим такие определения. Так, Аристотель в своем труде «Метафизика» говорит, что стремление к знанию – одно из основных свойств человека. Или более современные: "Cognition is a prosess of active exploring the environment and creating various types of new knowledge by some entity in order to optimize its living processes and/or gain goals". – «Познание есть процесс активного исследования окружающей среды и создания различных типов знания с целью оптимизации жизненных процессов и достижения тех или иных целей».

«Знания есть совокупность понятий и представлений об объективной действительности, их внутренне взаимосвязанных систем (суждений, положений, концепций, теорий и т.д.), вырабатываемых обществом в процессе познания и преобразования мира. Зародившееся в эпоху первобытного духовно-физического синкретизма трудовой деятельности человека и продуцируемое в последующем в специализированной – научной – деятельности общества в первую очередь для достижения практических целей знание все шире охватывает объект, все глубже проникает в его тайны, т.е. развивается как в экстенсивном, так и в интенсивном плане...» [6].

Это примеры общефилософского, достаточно корректного, но также довольно бесполезного для практических приложений определения.

Как можно видеть из этих определений, они дают общее представление о том, что такое знание или познание как когнитивный процесс. Но для того чтобы построить КС, основанную на знаниях, этого мало. Нужно знать по меньшей мере:
  1. Чем знание отличается от подобных ему понятий – данных и информации?
  2. Какие существуют способы представления или обработки знаний в КС?
  3. Какие существуют источники знания?

Поэтому в задачах информатики можно и более удобно определить категорию знания в каком-то смысле косвенно – через самые разнообразные его свойства и методы обработки. Видимо, в нашем случае тоже придется пойти этим путем.


Локализация знания


По-видимому, проще всего начать с вопроса: «Где находится знание?». То есть с проблемы его локализации. Эта проблема не настолько тривиальна, как может показаться. Для этого лучше всего начать с классики.

Как известно, философские системы в зависимости от признания первичности существования одного из первых двух миров (реального и внутреннего мира человека) делятся на материалистические (первичность материального или реального мира – R) или идеалистические (первичность духа или внутреннего мира – М). Однако понятие слова как обобщенный образ знакового мира также встречается в текстах, и даже в очень древних. Обсуждается также и вопрос о его существовании и первичности. Так, гностическое евангелие от Иоанна начинается со слов «Вначале было Слово, и Слово было у Бога и Слово было Бог». Достаточно ясно сказано о Слове как о третьем мире и о проблеме его первичности, происхождения и т.д. – причем достаточно авторитетным автором. Если приостановить теперь философские и богословские рассуждения, то можно перейти к практическим выводам о локализации знания в одном из этих трех миров.

То есть теперь можно продолжить рассуждение о том, как эта теоретическая конструкция может послужить информационным технологиям, в частности, более ясному пониманию того, что есть знание. Здесь, как уже говорилось, более актуальной и плодотворной является проблема не первичности, а принадлежности. Действительно, данные – это явления реального мира. Это намагниченные участки дисков, бороздки грампластинок и CD, модулированные радиоволны и т.д. Их можно измерить, а часто и увидеть или пощупать. Однако эти данные несут в себе закодированную информацию, которая может быть воспринята только в том случае, если она преобразуется в знаки – например, визуальные, звуковые. На экране компьютера мы видим их знаковое содержание. Через динамик мы слышим закодированные звуки с грампластинки или переданные по радио. Это не является открытием, а констатацией факта. То есть информация имеет знаковую природу и принадлежит миру знаков. Аналогичное рассуждение приводит к выводу, что знание принадлежит внутреннему миру человека. В полном объеме только в сознании человека происходят сложные и простые когнитивные процессы – от сложных доказательств теорем до аристотелевых силлогизмов. И сейчас ведутся работы по моделированию и переносу самых элементарных их этих процессов в кибернетические системы.

Для пояснения (хотя бы в первом приближении) этого важного факта можно привести достаточно тривиальный пример из школьной практики. Школьные учителя занимаются тем, что управляют процессом преобразования информации, находящейся в школьных учебниках (которые школьники часто читают «от сих до сих») в знания. При этом при опросе учеников учителя профессионально при помощи специальных вопросов выясняют, находится ли в голове у школьника запомненная информация из учебника (то есть он урок зазубрил) или она преобразовалась в знание. Более точно один из критериев различимости информации и знания будет описан ниже.

Итак, данные – это объекты материального мира. Информация – это знаки, полученные при преобразовании данных в сознании человека или в процессоре компьютера. Знания же пока есть только у человека или в самом элементарном виде в кибернетических системах (КС). Но пока не в системах управления знаниями, которые так часто называются из маркетинговых соображений и представляют собой чаще всего очень совершенные системы управления информацией (или данными – так как обработка начинается со считывания данных, преобразования их в информацию и т.д.).


Элементарный акт обработки знания.

Критерий существования знания


Можно теперь проиллюстрировать и уточнить проделанное рассуждение. Действительно, если мы введем в КС следующие два факта:

1. Студент Петров учится в 925-й группе.

2. Студенты Иванов и Петров учатся в одной группе.

Если после этого мы сделаем системе запрос:

– В какой группе учится студент Иванов?

То на этот вопрос ответит любой школьник, но представляется интересным узнать – какая система управления знаний ответит правильно на такой вопрос.

Здесь и пролегает различие между самой передовой системой управления знаниями (в описанном выше смысле – как совершенная ИС) и системой, на самом деле способной обрабатывать знания. Такой системе присуще существенное свойство, которое можно принять за критерий определения настоящей системы, работающей со знаниями, а именно – способность порождать новые или прибавочные знания в результате собственных внутренних когнитивных процессов [1,2,3,7]. Можно здесь вернуться к примеру со школьниками. Конечно, в таком простейшем случае любой школьник ответит, в какой группе учится Иванов. Однако, прочитав заданный учителем текст из учебника, не каждый школьник способен преобразовать его в знания, то есть уметь при необходимости порождать новые знания.

Как уже говорилось в предисловии, одной из целей, преследуемых в данном курсе, есть стремление максимально ясно (в условиях, когда этой ясности, например резкой границы между понятиями) описать тем не менее основные понятия, парадигмы и технологии, понимаемые в информатике под термином «управление знаниями» или часто употребляемым его английским эквивалентом “knowledge management”.

Итак, мы знаем, что знания находятся в сознании человека или достаточно сложной КС. Критерием того, что там находятся знания по какой-то проблемной области есть способность порождать (генерация или автогенерация) новых знаний. Можно сказать, что критерий генерации прибавочного знания есть способности ИС (КС) обрабатывать знания.


Источники знаний


Следует сразу обратить внимание еще на один важный факт, требующийся для понимания некоторой философской культуры. Источник знания не есть еще само знание. Текст есть знаковая конструкция и часто содержит знание. Но текст есть не знание, а только его источник. Знания из текста еще нужно извлечь. Человеку или КС. Библия содержит много знаний, но всякий извлекает их по-своему и не все, что оттуда можно потенциально извлечь. Хотя часто можно встретить утверждение, что текст (особенно высокоформализованный текст – например математическая статья) – это знание. Это справедливо разве что в том смысле, что знания оттуда легче извлекать. Это также справедливо для реальной действительности – окружающего нас материального мира. Там в скрытой форме содержится огромный объем знаний. И выявить и описать их – задача самых разных наук. То есть окружающий нас материальный мир – это тоже есть не знание, а только его источник. Так же как и одно из его реализаций – данные на любом материальном носителе.

Здесь можно только кратко коснуться проблемы извлечения знаний. Полученные знания могут быть представлены (то есть заново овеществлены) в самой различной форме – законов, универсалий, определений и даже не вполне понятных текстов.


Понятие предметной области (knowledge domain)


Пользуясь парадигмой трех миров, теперь можно достаточно четко определить понятие предметной области (ПО) или knowledge domain или просто domain, часто используемой в информатике и других когнитивных науках. Действительно, по признаку принадлежности к одному из трех миров, человеческую деятельность (часто формально) можно разделить на три вида – предметную деятельность, реализуемую в материальном мире (R), мыслительную деятельность и знаковую деятельность. На практике их часто невозможно разделить. Даже для того чтобы построить сарай, нужно в голове иметь его замысел и набросать на бумаге простейший план.

Поэтому под предметной областью, относящейся к данной задаче (теоретической или практической), имеется в виду то множество материальных, мыслительных, знаковых объектов, их качеств и взаимосвязей, задействованных в данном виде деятельности.

Чтобы изложение не было слишком абстрактным, можно взять для упражнения определение ПО для бильярда, футбола, оперы, жилищного строительства и т.п. Такая возможность будет реализована при выполнении лабораторной работы по кодированию онтологий.


Диалектика соотношения «знания–информация–данные»


Как уже говорилось, знания, информация и данные – не одно и то же. Но очень часто для этого есть основания. Действительно, расширим описанный выше пример о студентах и представим, что в КС занесено огромное количество информации (конечно, в форме данных) о студентах. Представим, что наша КС не способна к выводам, т.е. к порождению новых знаний. Тем не менее она будет способна отвечать, то есть выдавать обратно пользователю по его запросу всю введенную в нее информацию. Представим теперь, что рассматриваемая КС способна делать простейшие выводы, описанные выше, хотя бы в рамках аристотелевых силлогизмов. Ясно, что с точки зрения пользователя здесь нет большой разницы, хотя с другой стороны разница принципиальна. Поэтому есть основания считать некоторую ИС, в которой хранится всего лишь огромное количество фактов, то есть информации системой управления знаниями с точки зрения практики, даже если она не способна делать простейшие выводы, то есть порождать новые факты.

Более того, на практике часто это не различимо. Пользователь не знает, каким образом в его ИС введена информация о студентах Иванове или Петрове. Для того, чтобы узнать, в какой группе Иванов, нужно только найти нужную запись. А для того, чтобы узнать, в какой группе Петров, нужно сгенерировать новое, до сих пор не известное знание. Но в обоих случаях это выдается в одинаковом виде. Только в последнем случае новую информацию нужно породить. Происходит процесс, описываемый следующей схемой:

К _____> I _____> D

Этот процесс называется процессом овеществления, или реификации знания.

Можно еще раз повториться, что для полного понимания этого процесса требуется некоторая философская культура. Для адекватного понимания таких процессов, собственно, и изучается философия в вузах.

Итак, типовая система, способная к обработке, то есть к извлечению и порождению новых знаний, будет состоять из двух взаимосвязанных блоков – базы знаний (KB – Knowledge Base) и когнитивного процессора, или процессора знаний (KP – Knowledge Processor), который, собственно, и реализует функцию обработки знаний, записанных в КВ:

[KB <____> KP]

Для пользователя по его запросу эти знания должны быть сгенерированы и преобразованы в форму информации (реифицированы):

User <____> I <___> [KB <____> KP]

Форматы представления знаний в КВ и способы их обработки в КР будут обсуждаться ниже.


Новый тривиум


Как уже говорилось во введении, сейчас, видимо, не требует доказательства факт бурного роста различного рода знаковых систем, повышения их роли в жизни общества, их поразительное разнообразие, а также многие другие их функции и свойства. Семиотика как наука об общих свойствах знаков и знаковых систем, из периферийной, экзотической или вспомогательной науки (нечто наподобие нумизматики) превращается в одну из ведущих научных дисциплин (по крайней мере, в информатике).

Действительно, в прошлом, несмотря на существование многих знаковых систем (ЗС), ведущей и основной ЗС был естественный язык (ЕЯ). Поэтому классическое образование людей строилось на тривиуме наук (откуда появилось выражение «тривиально») – грамматике, риторике и богословии. Если вспомнить о предмете этих наук, то, с точки зрения семиотики, грамматика – это синтактика ЕЯ, а риторика и богословие позволяют правильно описывать семантику и реализовывать прагматическую функцию речи, следовательно, строить все свое поведение. С учетом изложенного выше, следует признать необходимость нового тривиума, построенного уже на семиотике «в чистом виде», положенной в основу преподавания – то есть на изучении синтактики, семантики и прагматики знаковых систем.

Эффективность технологий, построенных на принципах нового тривиума, учитывающего реалии и универсалии трех миров (реального, знакового и сознания), может быть проиллюстрирована на примере технологии получения американцами информации у своих пленных в Ираке. Действительно, только специалист мог заметить в противоречивых сообщениях СМИ многие существенные черты этой технологии. Но там были особенности, на которые стоило обратить внимание. Действительно, практически не подвергая серьезному физическому воздействию тела иракских пленных, им наносили жестокие (согласно нормам их мусульманской культуры) моральные пытки, заставляя принимать непристойные позы. Но дело не ограничивалось этим. Делались фотографии с угрозой их публикации с целью дискредитации этих людей в глазах их родственников и соседей, что было равнозначно их гражданской смерти. Видимо, эти технологии, построенные с учетом семиотических особенностей местной цивилизации, оказались эффективнее примитивного вышибания показаний [11].