И. В. Усманова Пензенский государственный педагогический университет им. В. Г. Белинского

Вид материалаДокументы

Содержание


Usmanova I.V. Knowledge representation models in document management.
Подобный материал:
Усманова И.В. Модели представления знаний в системах управления документооборотом. // Проблемы информатики в образовании, управлении, экономике и технике: Сб. статей Междунар. научно-техн. конф.– Пенза: ПДЗ, 2010. – С. 189-192.


МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
В СИСТЕМАХ УПРАВЛЕНИЯ ДОКУМЕНТООБОРОТОМ


И.В. Усманова

Пензенский государственный педагогический университет
им. В.Г. Белинского,
г. Пенза, Россия

Рассматриваются модели представления знаний, которые могут быть использованы для оценки состояния документооборота в организации и прогнозирования развития сложившейся ситуации.


Usmanova I.V. Knowledge representation models in document management. The models of knowledge representation that can be used to assess the status of documents in the organization and the prognosis of the situation are considered.


Корпоративные знания становятся все более важным ресурсом современной организации. Непрерывное возрастание объемов и темпов обработки информации в связи с общим ускорением проектирования и реализации бизнес-процессов делает все более необходимым использование при решении различных вопросов сведений об общих закономерностях, существующих в данной предметной области. В настоящее время на практике все чаще ставится вопрос о необходимости комплексной автоматизации деятельности предприятия и разработки систем управления знаниями.

В условиях рыночной экономики для большинства предприятий характерно постоянное изменение состава и объема производства товаров, сопровождающее их преобразования организационной структуры и, как следствие, изменение состава образующихся документопотоков и направления их движения. Применение на предприятии системы электронного документооборота (СЭД) позволяет резко сократить время на выполнение рутинных операций, связанных, прежде всего, с передачей документов заинтересованным должностным лицам, а также повысить сохранность информации. Применение технологий управления знаниями создает возможность сокращения времени подготовки документа в целом.

Вне зависимости от особенностей архитектуры конкретной системы управления знаниями ее обязательным компонентом является система управления документооборотом. Необходимым условием повышения эффективности применения СЭД является введение в состав системы управления документооборотом программного модуля, предназначенного для анализа состояния документооборота.

В настоящее время общепринятой нормой является учет объема документооборота и выявление количества не исполненных в срок документов. Анализ документооборота производится на смысловом, качественном уровне, а сам этот процесс носит субъективный характер и отражает взгляды должностного лица, его производящего. Не существует формализованной методики оценки направления и состава документопотоков из-за отсутствия интегрального показателя качества документооборота или универсальной системы показателей качества документооборота, обладающей свойствами полноты и неизбыточности и не зависящей от специфики деятельности предприятия.

Между тем любая система управления знаниями не отрицает целесообразность применения методов экспертных систем для решения конкретных проблем. Задача анализа документооборота имеет смысловой характер, требует применения эвристических правил, основанных на опыте профессиональной работы, представляет практический интерес и может быть решена при помощи технологий поиска с использованием семантических сетей, которые давно и успешно применяются для представления самых разнообразных знаний в различных предметных областях.

Для решения задачи анализа документооборота предлагается использовать две модели представления знаний (МПЗ). Первая из них имеет иерархическую древовидную структуру и предназначена для логической организации множества понятий делопроизводства и области деятельности организации. Узлами сети являются понятия предметной области, а дугам соответствуют отношения смысловой зависимости между понятиями. Эта модель используется, прежде всего, для организации обмена сообщениями между пользователем и системой и позволяет выделить поддеревья родственных понятий, что сужает область поиска необходимой информации. Кроме того, классификационная схема позволяет выполнить настройку используемых в системе показателей оценки на особенности применяемой процедуры оценки.

Вторая МПЗ предназначена для логической организации сведений об основных закономерностях между отдельными показателями состояния документооборота и используется для формирования его оценки. Состояние документооборота определяется состоянием наборов данных, описывающих реальную ситуацию на предприятии и характеризующихся степенью их соответствия нормативным документам и концептуальной модели документооборота в сознании человека.

Специфика сведений о состоянии документооборота заключается в их нечеткости и неполной определенности и наиболее полно может быть учтена в предложениях естественного языка. Поэтому вторая модель представления знаний должна быть двухуровневой. Первый уровень образует семантическая сеть, узлами которой являются утверждения, представляющие собой предложения естественного языка. Они содержат частные оценки состояния документооборота и бизнес-процессов, отражают эмпирические закономерности между появлением отдельных показателей состояния и являются основой для формирования прогнозов развития текущей ситуации.

Например, если должностное лицо очевидно перегружено операциями по согласованию документов и является адресатом или получает для исполнения большое количество внутренних и входящих документов, то под угрозой оказываются сроки и качество исполнения бизнес-процессов, в которых он занят. Если эти процессы относятся к категории основных для данной организации, то можно сделать вывод о возникновении опасности снижения каких-либо показателей эффективности деятельности организации в целом. В описании рассмотренной ситуации могут быть выделены несколько утверждений, одним из которых является утверждение «Количество согласований документов сотрудником велико».

Вершинам сети первого уровня предлагается поставить в соответствие утверждения четырех групп: показатели состояния документооборота; показатели эффективности бизнес-процессов; показатели эффективности деятельности организации; показатели эффективности СЭД. С каждым утверждением связано исходное значение вероятности, выражающее степень влияния данного показателя на показатели эффективности процесса деятельности и определяемое экспертом.

Смысловые отношения вершин представляются дугами различных типов. Каждое отношение характеризуется наличием выраженного влияния одного показателя состояния на другой. Дуга с инцидентными ей узлами есть семантическое представление правила, отражающего установленную эмпирически возможность появления одного показателя в случае появления второго.

Предложения естественного языка позволяют наиболее полно выразить содержание показателей оценки вследствие присущей им нечеткости и неполной определенности. Это обусловливает сложность синтаксиса и семантики предложений и предъявляет серьезные требования к гибкости модели представления знаний и возможности ее настройки на особенности конкретного предприятия.

Поэтому второй уровень рассматриваемой модели образуют семантические представления отдельных утверждений, необходимые для выполнения оценки соответствующего показателя состояния документооборота. Утверждение является семантической конструкцией, узлами которой являются понятия поддеревьев первой МПЗ, а также семантические отношения и операции вычисления утверждений. Дуги указывают на установление семантических отношений между понятиями. Основным требованием к структуре утверждения является его лаконичность. Грамматическая основа утверждения представляет собой логическую посылку для описания констатируемого факта (как, например, в утверждении «Состав документов подразделений неоднороден») или ожидаемый результат вычислений («Количество согласований документов сотрудником велико»).

В каждом представлении утверждения выделяются две части. Первая содержит понятия, участвующие в констатации основного факта утверждения, и все семантические отношения, описывающие утверждение. Для последнего утверждения такими понятиями являются «сотрудник», «документ», «виза согласования». Эта часть постоянна и не зависит от применяемых для вычисления значения утверждения моделей и наборов данных.

Вторая часть утверждения образована внешними ссылками, соотносящими понятия утверждения с другими понятиями классификационной схемы первой МПЗ и позволяющими настраивать утверждение на конкретную ситуацию. Например, слово «велико» в разных обстоятельствах может интерпретироваться следующим образом: как максимальное абсолютное значение количества виз согласования, проставляемых конкретным должностным лицом в какой-либо период времени; как наибольшее значение количество процедур согласования, выполняемых каким-либо сотрудником по сравнению с другими; как превышение количества виз согласования, проставляемых должностным лицом, среднего количества виз согласования для сотрудников соответствующего уровня управления на определенную величину.

По существу, каждое представление утверждения есть фрейм-прототип, т.е. описание стереотипной ситуации, задаваемой утверждением. Гибкость структуры фрейма достигается за счет использования слотов, которым соответствуют внешние ссылки семантических представлений утверждений. Для каждого слота следует задать правило присваивания.

Фрейм-пример для каждого утверждения содержит описание конкретной программы для его вычисления. Например, в приведенном выше примере для вычислений должны быть использованы отличающиеся друг от друга выборки данных в зависимости от особенностей проводимого пользователем анализа документооборота.

Рассмотренная модель представления знаний предполагает использование известного метода Байеса для организации логического вывода с целью оценки состояния документооборота и прогнозирования дальнейшего развития ситуации, сложившейся в организации. Она является инвариантной к предметной области и может быть применена для решения широкого спектра задач в области разработки систем управления документооборотом.