Системантика

Вид материалаМонография

Содержание


1. Организация «памяти»
2. Информационный поиск
По режиму поиска
По типу языка
По типу критерия соответствия
По степени автоматизации
1   ...   15   16   17   18   19   20   21   22   ...   32

1. Организация «памяти»



Центральной частью любой реальной системы, предназначенной для хранения знаний, является поисковый массив. Знания фиксируются в запоминающих устройствах в виде фактов, документов или их копий (объектов) с их поисковыми характеристиками. Поисковый массив – это организованное соответствующим образом множество документов, копий или фактов, снабженное поисковыми характеристиками, среди которых отыскиваются объекты, удовлетворяющие поисковым требованиям.

Поисковый массив разделяется на активный и пассивный. Активный массив содержит поисковые характеристики с адресами хранения объектов в пассивном массиве. Пассивный массив образуют документы или их копии, если поиск в нем производится только по адресным шифрам предположительно релевантных документов.

Наибольшее распространение получили две формы организации массива – прямая и инверсная (рис. 67).



Рис. 67. Схема организации поискового массива

При прямой организации поискового массива отыскание релевантных документов производится путем поочередного сравнения поискового образа каждого документа массива с поисковым предписанием и выдачи таких документов, в отношении которых выполняется заданный критерий выдачи. Основными достоинствами прямой организации поискового массива являются простота, экономное использование памяти и возможность легко вносить изменения. Недостатком является необходимость просмотра всего массива при каждом запросе, что ухудшает временные характеристики поиска.

При инверсной организации поискового массива процедура поиска складывается из двух этапов. Сначала выбираются все документы по каждому отдельному дескриптору, входящему в поисковое предписание. Затем в отобранном массиве документов находят те, в отношении которых выполняются все логические условия, заданные в поисковом предписании.

Основным достоинством инверсной схемы являются лучшие временные характеристики поиска. Недостатком является трудность внесения изменений.

Прямая и инверсная схемы организации поисковых массивов взаимно дополняют друг друга. При такой «дуальной» организации поискового массива инверсная схема служит для сокращения пространства поиска, а сам информационный поиск производится в массиве, организованном по прямой схеме. Недостатки «дуальной» организации поискового массива состоят в увеличении объема памяти для хранения избыточной информации, появляющейся за счет дублирования данных в указанных двух массивах, а также в увеличивающейся трудности внесения изменений.

Указанные недостатки «дуальной» организации поисковых массивов можно устранить введением списковой структуры.

Списковый способ заключается в том, что в поисковом массиве под каждым дескриптором сначала дается полный поисковый образ самого последнего документа, введенного в систему, а также адрес предшествовавшего ему документа, в конечный образ которого входит этот дескриптор. Таким образом, создается цепочка, следуя которой можно выявить все документы, содержащие в поисковых образах данный дескриптор.

Поиск информации при компьютерной обработке является массовой процедурой. В зависимости от объекта выделяются несколько видов поиска: поиск решения, информационный поиск, а также технологический поиск, включающий методы доступа к данным. Все указанные виды поиска базируются на стратегиях поиска, уменьшающих пространство поиска и распараллеливающих процесс поиска.

2. Информационный поиск



Информационный поиск – это процесс отыскания в некотором массиве нужных знаний или данных. Процедуры информационного поиска являются массовыми в любых системах автоматической обработки информации. Процесс информационного поиска обусловлен необходимостью удовлетворения информационной потребности пользователя или условием решения задач.

Информационная потребность отражает намеченные цели и однозначно определяется решаемыми задачами.

Устанавливаемое при информационном поиске соответствие найденных знаний или данных информационным потребностям называется пертинентностью (рис. 68).



Рис. 68. Соотношение между пертинентностью, смысловой и формальной релевантностью

Смысловое соответствие текста (документа, фактографической записи) информационному запросу называется смысловой релевантностью, соответствие поискового образа документа поисковому предписанию – формальной релевантностью. Существуют критерии формального и смыслового соответствия.

Критерий смыслового соответствия формируется человеком и устанавливает соответствие между выдачей и смыслом запроса.

Под критерием формального соответствия понимается совокупность признаков, согласно которым осуществляются формальный отбор и выдача адресов. По этим адресам хранятся необходимые знания и данные. Существует несколько типов критериев формального соответствия.

Рассмотрим это на примере поиска документов:

Документ

Операторы




x1

x2



xn

Д1

0

1



1

Д2

1

0



1











Дв

1

1



0


Критерии формального соответствия выражаются через булевы функции:

В[x1, x2, ... xn]

Di(i=1 ... n)

Условие выдачи В[x1 (Di), ... xn (Di)] = 1.

Могут быть функции другого вида:

F(x1, x2, ... xn), и величины Yo – пороговая величина;

F[x1 (Di), ... xn (Di)] > Y0;

F = y1x1 + y2x2 + ... + ynxn;

Vi = 1,1,1,0,1,1 – запросы;

Wi = 1,1,1,1,0,1 – документы.

1 тип критерия соответствия:




2 тип критерия соответствия:


.


3 тип критерия соответствия:


.


Машины оперируют адресами. Для того чтобы выйти на адреса, существуют схемы поиска в глубину и ширину (рис. 69) и механизм индексов (рис. 70).




Рис. 69. Схемы поиска


Автоматизированные информационные системы (АИС) предназначены для накопления, поиска и обработки информации различного рода. В зависимости от целевого назначения АИС подразделяются на информационно-справочные и информационно-советующие. Первые обеспечивают сбор и частичную подготовку информации для ее использования человеком, вторые подготавливают определенные советы и рекомендации по управлению каким-либо процессом.



Рис. 70. Методы поиска


Задачи, решаемые АИС, делятся на два класса: информационные и технологические. Информационные обеспечивают ввод и модификацию информации, формирование и вывод информации, технологические – процесс функционирования АИС.

1. К информационным задачам относятся:

а) задачи ввода информации обеспечивают ввод форматированной и неформатированной (текстовой) информации. Может осуществляться оперативно и по регламенту;

б) задачи корректировки информации дают возможность вносить изменения в ранее введенную информацию (включать, исключать, заменять);

в) учетно-статистические задачи выдают информацию по запросам. Запросы могут быть стандартные и нестандартные. Стандартные организованы в библиотеку запросов и имеют свои идентификаторы. Обслуживание по стандартным запросам сокращает время решения задач. Информационные задачи решаются, как правило, в диалоговом режиме (возможен регламентный режим). Выдаваемая пользователю информация не обрабатывается;

г) информационно-расчетные задачи предназначены для формирования качественно новой информации на текущий момент или за определенный период;

д) информационно-статистические задачи предназначены для автоматизации расчетов и моделирования процессов.

2. К технологическим задачиам относятся:

а) задачи, которые обеспечивают настройку всех компонент АИС на конкретное применение, контроль правильности, а также сопровождение системы;

б) задачи развития АИС, которые предназначены для адаптации системы;

в) задачи обучения, которые содержат обучающие курсы;

г) задачи документирования, которые применяются для автоматического оформления технической документации.

Центральный элемент любой АИС – информационно-поисковая система (рис. 71, 72).



Рис. 71. Схема взаимодействия создателей и потребителей информации
с информационно-поисковой системой



Рис. 72. Блок-схема информационно-поисковой системы


Информационно-поисковые системы делятся по роду выполняемых функций на:

документальные (в ответ на запрос выдают адреса хранения документов);

фактографические (выдают в ответ на запрос фактические сведения);

логические (содержат элементы всех трех систем);

комплексные (выдают содержащуюся информацию в преобразованном виде).

По режиму поиска системы могут быть ретроспективные; избирательного распределения.

Ретроспективный поиск осуществляется по всему информационному фонду, а избирательное распределение – по вновь вводимым документам.

По типу языка системы бывают с естественным языком; с информационно-поисковым языком.

В системах с естественным языком сравнение смысла запроса и смысла документа происходит на естественном языке по законам анализа и синтеза текста.

В системах с информационно-поисковым языком сравнивается основное содержание запроса и документа (ключи). Сравнение осуществляется по формальному критерию соответствия.

По типу критерия соответствия системы делятся на основаные на логических функциях (и, или, не) и основанные на числовых коэффициентах.

По степени совпадения системы делятся на системы полного включения; полного вхождения; частичного совпадения.

По степени автоматизации в системах могут быть автоматические: поиск; выдача ответа; индексирование; управление.

Параллельный информационный поиск на примере квадратного уравнения



Последовательную реализацию алгоритма решения можно представить в виде:

a

b

c

(2)

(1)X(3)

(4)-(5)

6

-(2)+(7)

-(2)-(7)

(8)/(1)

(9)/(1)

1

2

3

4

5

6

7

8

9

10

11


Параллельную реализацию можно представить в виде, показанном на рис. 73.




Рис. 73. Параллельная реализация алгоритма решения