Учебное пособие для студентов библиотечного факультета Кемерово 1981 г

Вид материалаУчебное пособие

Содержание


Автоматизированные информационно-поисковые системы
2. Режимы работы автоматизированных информационно-поисковых систем
Автоматизированные библиотечно-библиографические системы.
Функциональная и организационная структура автоматизированных информационно-поисковых систем.
Подсистема обработки информации
Технология подготовки исходной информации для ввода в базу данных
Подсистема хранения и поиска информации
Подсистема поиска информации
Автоматизированная система управления АИС
Лингвистическое обеспечение автоматизированных информационных систем
Основные разделы КГС
Информационно-поисковые тезаурусы
Продукция кабельная.
Глава IV. Программирование. Программное обеспечение автоматизированных информационно-поисковых систем
Дескрипторная статья
Программное обеспечение
Информационное обеспечение автоматизированных информационно-поисковых систем
Отечественные отраслевые автоматизированные информационно-поисковые системы
Автоматизированные системы научно-технической информации Республиканских и межотраслевых территориальных центров
Зарубежные автоматизированные информационно-поисковые системы
...
Полное содержание
Подобный материал:
  1   2   3   4   5   6   7   8   9


Кемеровский государственный институт культуры

Кафедра научно-технической информации


Рукопись


Сбитнев С. А.


АВТОМАТИЗИРОВАННЫЕ ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ

Учебное пособие для студентов библиотечного факультета


Кемерово

1981 г.


Предисловие


Учебное пособие «Автоматизированные информационные и библиотечные системы» соответствуют разделам программы курса «Основы информатики» утвержденной в 1979 году для институтов культуры и педагогических вузов по специальности № 2113 «Библиотековедение и библиография».

Основное внимание в пособие сосредотачивается не на средствах вычислительной техники, которые используются в автоматизированных информационных поисковых системах, а на технологии механизации и автоматизации процессов связанных с эксплуатацией автоматизированных информационно-поисковых систем.

Последовательность изложения материала соответствует программе «Основы информатики».

Подготовка пособия предпринята как реакция на отсутствие учебника и других пособий, где студент – заочник мог бы найти систематизированное изложение материала по разделу АИС.

При написании пособия учтен многолетний опыт преподавания автором курса на библиотечном факультете Кемеровского государственного института культуры.


АВТОМАТИЗИРОВАННЫЕ ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ


1. Основные понятия и определения

Под системой понимается совокупность элементов (подсистем, блоков) взаимосвязанных между собой. При этом каждый элемент системы выполняет свою специфическую функцию. Вся совокупность элементов в системе рассматривается как единое структурное целое.

Информационно-поисковая система – это система блоков (подсистем), которые обеспечивают реализацию функций сбора (комплектования), обработки (процессы каталогизации – библиографическое описание и классификация), хранения, поиска, выдачи и распространения информации. В информационно-поисковой системе может быть представлен тот или иной вариант набора названных элементов; но обязательными элементами являются информационный массив документов (поисковых образов), информационно-поисковый язык с общими и частными правилами перевода текста документа и/или запроса с естественного языка на информационный язык системы (например, УДК, ББК, рубрикаторы, ИПЯ дескрипторного типа), средства реализации стратегии поиска (например, ЭВМ, средства репрографии), а также оператор (посредник).

Автоматизированная информационно-поисковая система есть совокупность структурно взаимосвязанных подсистем, предназначенных для сбора, обработки, хранения, поиска и выдачи и распространения научно-технической, технико-экономической и технологической информации на базе развитых информационно-поисковых массивов с широким применением средств механизации и автоматизации подготовки, ввода и вывода информации результатов поиска в удобной для работы с ней форме (тесты, таблицы, графики, чертежи).

Массивом информации (информационно-поисковым называется совокупность информации, хранящейся в закрепленном виде в том или ином запоминающем устройстве (перфокарта, магнитная лента, магнитный диск, перфолента, библиотечная карточка).

Запоминающее устройство – часть вычислительной машины или самостоятельное устройство, предназначенное для записи и хранения информации.

2. классификация автоматизированных информационно-поисковых систем

В каждой области научных знаний вырабатываются понятия, связанные с данной областью знаний, чтобы охватить систему понятий той или иной тематической направленности необходимо мысленно сделать срез ее структуры и объединить понятия в некоторые категории – в такие, например, как предметы, процессы, свойства, величины.

Для того, чтобы осуществить процедуру классификации предметов, процессов, свойств необходимо выбрать подход к делению предметов на классы. Таким подходом при классификации является набор основания деления. В качестве основания деления должен быть выбран такой признак, который бы отражал существенные и действительные связи между классифицируемыми предметами, процессами. Для классификации объектов может быть выбрано также несколько оснований для деления. Все информационно-поисковые системы, в том числе и автоматизированные, функционируют на базе сведений, содержащихся и извлеченных из документа. В результате процедуры анализа документа из него выделяют некоторые элементы. Одни из этих элементов принято относить к библиографическим (заголовок, заглавие, выходные данные, количественная характеристика). Другие относятся к типу элементов, которые раскрывают содержание документов , к ним относятся тематические и предметные рубрики, ключевые слова. Отторгнутые от документа элементы после проведения с ним некоторых формальных (обязательных) и логических процедур синтеза образуют некоторые структуры, например, поисковый образ документов (ПОД). Поисковые образы сами по себе могут образовывать более сложные структуры в информационно-поисковых массивах и при этом выполнять коммуникативную, поисковую и научно-познавательную функцию. Отторжение элементов от документа или запроса, их структурирования, а также перевод с естественного языка на язык ИПС, как известно, в традиционных информационно-поисковых системах (библиотеках) осуществлялись вручную. С появлением средств вычислительной техники, репрографии и микрофильмирования стало возможным не только механизировать, но и автоматизировать многие технологические процессы и операции (выделение ключевых слов. Перевод их в дескрипторы, образование ПОД и ПП, а также поиск и выдачу не только вторичных, но и первичных документов, включая автоматизацию научно-технического перевода, реферирования.

Таким образом, в качестве деления понятия «Автоматизированные информационно поисковые системы» может выступать уровень аналитико-синтетической переработки научных документов и образование структур вторичных документов в виде библиографического описания, реферата, аннотации, научного перевода, включая систематизацию выделенной из документа информации дол уровня новой информации, а также способность систем образовывать сложные структуры в поисковых массивах. Процедура систематизации (образование структур) может оцениваться по уровню образованных структур (например, библиографическое описание. Аннотация, реферат). Уровень систематизации (синтеза) сведений, выделенных из документа может оцениваться на основе сопоставительных характеристик с их критической оценкой, а также синтезированием выделенных сведений до получения новых знаний. По уровню и характеру систематизации выделенных из документа сведений различают три типа автоматизированных информационно-поисковых систем: документальные, фактографические и информационно-логические.

Документальная автоматизированная информационно-поисковая система – система, предназначенная для поиска и выдачи адресов релевантных документов, их библиографических описаний самих документов или их копий. Характерной особенностью систем этого типа является то, что процедура поиска информации завершается выдачей документов, содержащих сведения, которые должен извлечь сам потребитель. Типичными документальными АИС являются Автоматизированная информационно-поисковая система «АССИСТЕНТ», а также АИС МЦНТИ – международного центра научно-технической информации. В первую из них вводятся опубликованные документы, во вторую отчеты о завершенных научных исследованиях, защищенных диссертациях.

Если сравнить процедуры отторжения элементов от документа в той и другой системах, как показано на рисунке , то в принципе они ничем не отличаются. Некоторые особенности анализа документов связаны, как это видно на рисунке с видами информационных услуг, которые представляются этими системами потребителю. Автоматизированные информационно-поисковые системы реализуются на электронно-вычислительных машинах. Использование ЭВМ обеспечивает без дополнительных затрат на обработку и систематизацию однажды введенных в них документов полный сервис в режимах «запрос – ответ», избирательное распространение информации, сигнальная информация, подготовка к изданию реферативных и библиографических пособий с различными вспомогательными показателями. АИС документального типа обеспечивают выдачу тематических подборок, библиографических списков. Такие АИС документального типа, которые при одноразовом вводе документов обеспечивают полный информационный сервис, т.е. многократное использование однажды введенных документов в различных формах информационного обслуживания принято называть интегральным.

Фактографические автоматизированные информационно-поисковые системы – это такие системы, которые предназначены для поиска, выдачи каких-либо данных, фактов, сведений. Не входя в дискуссию по выявлению объема содержания понятия «факт» укажем, что оно образовано от латинского Factum – сделанное, совершенное. Понятие «факт» дало название целому классу автоматизированных ИПС «фактографических».

Чтобы отличить фактографические ИПС от документальных, характерной которых является то, что результатом информационного поиска является выдача системой адреса или самого документа, который содержит затребованные сведения, данные. Фактографические АИПС, реализуют информационный поиск выдачей самих сведений, данных, фактов без отсылки к документам. Принципы построения фактографических АИПС отличаются от принципов построения документальных АИПС. В документальных ИПС при аналитическом описании документа выделяются такие элементы, по которым возможен поиск любого документа по его адресу или же содержанию. В фактографических ИПС элементарными единицами информации являются реквизиты обязательные данные, установленные законом или нормативно технической документацией, например, Гостами, техническими условиями. Реквизиты отражают определенные научные, технические, экономические свойства процессов, явлений, объектов и являются логически неделимыми элементами любой сложности. Реквизитам присущи два свойства, весьма важные с точки зрения их обработки. Первое, отдельный реквизит может входить в состав различных составных единиц информации, и второе, отдельно взятый реквизит не может полностью характеризировать объект, процесс, явление. Каждый реквизит характеризируется именем (наименованием), значением и типом. Совокупность характеристик образует форму реквизита.

В зависимости от характера отображаемого ими свойства реквизиты (данные) делятся на реквизиты - признаки и реквизиты – основания. Качественные свойства объекта, процесса или явления отражают реквизиты-признаки. Признаки могут быть выражены в алфавитном, цифровом, алфавитно-цифровом виде и являются основой для логической обработки составных единиц информации. С признаками, как единицами информации можно проводить процедуры поиска, сортировки, выборки, группировки.

«Реквизиты – основания» отражают количественные характеристики объектов, процессов, явлений. Реквизиты основания всегда выражены в цифровом коде.

В качестве реквизитов – признаков для объекта «электронно-копировальные аппараты для электроискрового изготовления трафаретных печатных форм» могут быть выделены следующие признаки – страна-изготовитель, производительность печатных форм/час, размер бумаги (мм), размер оттиска (мм), напряжение (вольт), габариты (мм), масса (вес) (кг).

Приведенные признаки являются качественными характеристиками объектов. Качественные характеристики, как в нашем примере, так и вообще, могут быть описаны количественными (цифровыми) параметрами. Для исчерпывающего описания объекта, процесса, явления необходима некоторая совокупность реквизитов, описывающих его качественные и количественные свойства. Такая совокупность признаков представляет собой сообщение об объекте. Каждое сообщение имеет определенную форму. Формы сообщений объединяются в множества реквизитов, полностью описывающих объект.

Частным случаем сообщения является показатель – составная единица информации, состоящая из одного реквизита основания и ряда характеризующих его и связанных с ним логическими отношениями реквизитов признаков. Показатели бывают постоянные и переменные. Выделение показателей в качестве единицы информации является полезным при классификации самих единиц информации, алгоритмизации, при размещении данных на различных носителях. При проектировании фактографических информационных систем важное значение приобретает выявление связей между показателями. Существующие связи между показателями можно разделить на алгоритмические, семантические и прагматические.

Алгоритмические связи между двумя показателями появляются тогда, когда количественные значения одного из них используются для получения количественных знаний другого. Семантические связи возникают между показателями тогда, когда они характеризуют один или взаимосвязанные объекты.

Прагматически связанными показателями считаются такие, которые используются для решения одной задачи.

В структуре показателей выделяются две части: наименование показателя и значение показателя – качественные и количественные параметры. Распознавание, выделение из текстов документов составных элементов фактографической информации представляет некоторую сложность. Обработка, манипулирование накапливаемой фактографической информацией затрудняет широкое их распространение.

Существующие в настоящее время фактографические АИПС по своим возможностям могут обеспечить выдачу информации по весьма определенному и ограниченному кругу вопросов. Фактографические АИПС пока не могут выдавать информации на множество запросов произвольного характера, хотя и запрос относится к заданной предметной области. Так, например, фактографическая АИПС «ФТОР», разработанная ВИНИТИ предназначена для решения только следующих задач:

- поиск реакций заданного типа;

- поиск реакций получения соединений заданного класса;

- поиск реакций, в которые вступают соединения заданного класса;

- поиск соединений заданного класса;
- поиск сведений о различных свойствах соединений и т.д.

Информационно-поисковый язык АИПС «ФТОР» отражает более 500 различных признаков, характеризующих реакции, соединения, предметы.

Информационно-логические автоматизированные информационно-поисковые системы – это совокупность информационного языка (это не ИПЯ), правил перевода с естественного языка на информационный и наоборот, а также правил логического (алгоритмического и эвристического) вывода. Эта система предназначена для автоматизированного получения новой информации из некоторой исходной. Под термином «новая информация» понимается такая информация, которая не содержится в явном виде в данном поисковом массиве, хотя она может быть абсолютно не новой, т.е. до того неизвестной ни одному из людей. Например, известно, что любая машина (аппарат) состоит из некоторого множества деталей(валов, муфт, подшипников и т.д.). При этом каждая деталь в машине имеет свое функциональное назначение, свои параметры. Требуется по заданным параметрам, назначению, области применения, короче говоря, по определенным техническим характеристикам сконструировать машину, которая отвечала бы техническому знанию. Такого или подобного типа задач должны выполнять информационно-логические системы.

Информационные языки логических информационно-поисковых систем это не информационно-поисковые языки, которые главным образом предназначаются для поиска текстов, предметов, тем, описанных в документах. Информационно-логические систем будут базироваться главным образом на языке и логике отдельных наук. Решение проблемы разработки логических информационно-поисковых систем, как нам кажется, лежит в русле формализации информационных языков, анализа систем понятий и методов рассуждений в конкретной области знаний, которую призвана обслуживать логическая информационно-поисковая система. Разработка логических информационных систем, как нам кажется, с решением глобального вопроса и возможности или невозможности познания механизма всех мыслительных процессов, их формализацию, а, следовательно, их моделирование.


2. Режимы работы автоматизированных информационно-поисковых систем


В основе создания современных систем информационного обеспечения ученых, специалистов лежит представление об уникальности информационных потребностей каждого ученого, каждого специалиста. Появление информационной потребности и оформление в устной или письменной форме запроса зависит от ряда факторов. В число таких факторов входят специфика решаемых задач в данный момент, уровень научной квалификации, опыт работы ученого, специалиста, их психолого-физиологические особенности.

Как отмечают исследователи информационных потребностей, проявляемых у ученых и специалистов, формулировки информационных запросов, их содержательная часть находится в постоянном изменении.

Поэтому понятно стремление и желание разработчиков и проектировщиков информационных систем создать такие системы, которые в максимальной степени индивидуализировали бы информационной обслуживание. Чтобы информационная система не только могла учитывать постоянные изменения информационных запросов, но и легко настраивалась бы на удовлетворение информационных запросов с учетом перечислены требований, т.е. была бы гибкой. Не случаен повышенный интерес работников служб информации и библиотек вызвали автоматизированные системы избирательного распространения информации (ИРИ). Автоматизированные системы ИРИ относятся к классу АИС документального типа. Для этого класса систем характерными признаками являются то, что:

Запросы формируются самим потребителем;

Информационное обслуживание базируется на документах текущего поступления;

Продолжительность обслуживания потребителя системой должно составлять не менее года;

Интервал выдачи должен быть минимальным (еженедельно, ежедневно, не менее двух раз в месяц);

Установление обратной связи с потребителем.

Обратная связь в системах ИРИ должна рассматриваться как инструмент, который помогает потребителю или его посреднику настроить систему так, чтобы она обеспечивала полноту и релевантность выданных документов.

Внедрение в практику работы служб информации автоматизированных систем ИРИ с возможностью реализовывать различные стратегии поиска (логической суммы, логического произведения, суммы логических произведений, логической разности). Повышала интерес работников служб и библиотек к этим системам, и они возлагали большие надежды на повышение качества обслуживания ученых и специалистов. Как показал опыт эксплуатации систем ИРИ с обратной связью, работникам служб удалось с помощью обратной связи добиваться повышения точности, полноты выдачи информации, а также снижения информационного шума. На основе анализа обратной связи стало возможным исключать из информационных сообщений тех документов, которые вводятся в систему с опозданием и тем самым снизить общие трудозатраты по эксплуатации систем ИРИ. Постоянный анализ обратной связью позволяет посреднику, представляющему интересы потребителя модернизировать (изменять) первоначальные формулировки информационных запросов, сужать или расширять границы поиска информации в массиве. Если отбросить тот факт, что обратная связь в системах ИРИ, которые эксплуатируются в настоящее время существует формально; то все равно абоненты системы были лишены возможности непосредственно принимать участие в изменении формулировок информационных запросов и тем самым они лишались возможности быстро получать документы или их копии в достаточно приемлемые для них сроки. Большой процент выдачи нерелевантных документов, из систем увеличивая не только трудоемкость по информационному обслуживанию, но и снижая технико-экономические показатели функционирования систем ИРИ. Известно, что в настоящее время эксплуатируемые системы ИРИ первоначально (в первом контуре) в ответ на запрос потребителя выдают вторичные документы (библиографическое описание, в лучшем случае реферат). По своему характеру вторичные документы при первоначальном ознакомлении с ними не позволяют потребителю сопоставить и определить семантическую релевантность документа, с которым в последующем потребитель должен ознакомиться и выделить сведения, относящиеся к его запросу. Не говоря уже о принятии решения по вторичному документу об использовании информации в научной, производственной или общественной работе. Не смотря на то, что существующие системы ИРИ имеют недостатки, они пока остаются одной из наиболее эффективных форм информационного обеспечения ученых и специалистов.

Распространение магнитно-ленточных изданий, с записанными в них вторичными документами, международными, национальными (всесоюзными), центральными отраслевыми, межотраслевыми республиканскими территориальными информационными центрами позволяют не только службам информации, научно-техническим библиотекам научно-производственных объединений, промышленных предприятий, исследовательским и разрабатывающим организациям, но и библиотекам министерства культуры СССР организовывать информационное обслуживание ученых и специалистов, используя для этих целей возможности вычислительных центров коллективного пользования на условиях аренды машинного времени. Использование магнитоленточных изданий, прежде всего освобождает персонал обслуживающий систему ИРИ, от подготовки машиночитаемых носителей информации и создает условия, когда можно значительно больше уделить внимания самим процессам информационного обслуживания. Несмотря на то, что системы ИРИ нашли широкое распространение не только у нас в стране, но и за рубежом, их эксплуатация еще не лишена многих недостатков. В частности, пока разработка стратегии поиска, определение информационных массивов в которых осуществляется поиск, модернизация (изменение) формулировки запроса, расширение и сужение областей поиска остается за посредником-оператором ИРИ. И он не всегда может в силу объективных причин достойно представлять интересы потребителя. Это не зависит от степени его желания.

Ответной реакцией на неудовлетворительность функционирования существующих систем ИРИ явилось создание автоматизированных информационно-поисковых систем, работающих в диалоговом режиме. Диалог в переводе с латинского обозначает разговор между двумя или несколькими лицами. Диалог по терминологии принятой в вычислительной технике обозначает процесс, характеризуемый беседой человека с электронно-вычислительной машиной. Из этого следует, что автоматизированные информационно-поисковые системы, которые обеспечивают условия общения человека с ЭВМ в форме беседы, разговорном режиме на естественном языке принято называть системами, работающими в диалоговом режиме.

Успех функционирования диалоговых систем зависит от возможностей электронно-вычислительных машин, с помощью которых реализована система, с одной стороны, средств связи потребителя с ЭВМ, а также языковых возможностей. Возможности ЭВМ, работающих в диалоговом режиме и возникающие при этом проблемы можно проиллюстрировать на примере поиска документов, имеющихся в библиотеке по теме «Библиографические указатели по горному делу». По-видимому, потребитель информации примет следующую стратегию поиска: отыщет в алфавитно-предметном указателе к систематическому каталогу в библиотеке или АПУ к таблицам классификации предметную рубрику «библиографические указатели», в которой будет записан шифр УДК тематической рубрики «отраслевые библиографические указатели» 016. в основных таблицах УДК в разделе «примечание» будет отсылка и отраслевые библиографические указатели литературы индексируются в разделе библиография УДК 016 в отношении отрасли.

Таким образом, библиографические указатели по горному делу получат шифр 016:622. отыскав ящик и соответствующий разделитель 016:622 потребитель обнаружит массив библиотечных карточек. После ознакомления с библиографическими записями, по-видимому, потребитель пожелает познакомиться со всеми документами и для этого он должен заполнить столько требовательных листков, сколько записей в массиве. Или же он ограничится каким-то числом записей и заполнит меньше листков. Работа с каталожным ящиком одного потребителя информации лишает возможности других потребителей работать с этим же массивом. В этом случае другие потребители должны работать последовательно, в порядке очередности. Разрешить проблему ликвидации очередей, по-видимому, будет легко в том случае, если в библиотеке окажутся несколько аналогичных массивов, повторяющих друг друга. Если реализовать идею поиска библиографических указателей с помощью ЭВМ с непосредственным доступом потребителя потребуются, чтобы ликвидировать очередь, поставить несколько ЭВМ (каждому потребителю ЭВМ). Такая постановка проблемы вполне разумна, а предлагаемый путь ее решения – абсолютная нелепость, со многих точек зрения, и в первую очередь с экономической. Машинное время – дорого. Решение проблемы ликвидации очередей создатели ЭВМ и разработчики программного обеспечения увидели в том, чтобы заставить ЭВМ работать в режиме разделения времени. Такой режим работы ЭВМ практически обеспечивает совместное одновременное пользование одной и той же ЭВМ, в одно и то же время многими потребителями для решения своих задач; связанных с информационным поиском в одном и том же или одних и тех же информационных массивах. Работа ЭВМ в режиме разделения времени, когда потребители пользуются в одно и то же время, реализуется за счет того, что каждая программа, каждого пользователя работает в течение весьма краткого времени по очереди, по круговой системе. Пользователь такой системы практически почти мгновенно получает какую-то часть и информации, которую он должен оценить или принять по ней какое-либо решение. Например, найденную ЭВМ информацию выдать в алфавитно-печатающее устройство. Пока он принимает то или иное решение, ЭВМ работает уже с другой программой, с другим потребителем, а у первого создается полная иллюзия, что только он один пользуется ЭВМ. Резервное время для подключения работы последующих программ и ликвидации очередей образуется за счет того, что процессор (основное вычислительное устройство ЭВМ), обеспечивающий заданные программой преобразования, при информационном поиске сравнения поискового образа документа с поисковым предписанием, работает со скоростью, которая превышает скорость работы выводных устройств (перфораторов, алфавитно-цифрового печатающего устройства и т.п.). для того, чтобы проследить прерывание и возобновление работы программы, обеспечивающей поиск и выдачу информации приводим пример диалога пользователя ЭВМ.

В указании (инструкции) о пользовании ЭВМ в диалоговом режиме находим указание: чтобы начать поиск информации, нажмите на клавишном устройстве дисплея (устройства для вывода результатов поиска, обработки и отображения текста, таблиц, графиков чертежей на экране электронно-лучевого прибора – кинескопа).

Клавиши

Изображение на экране

А

Поиск. Библиотека.

Б

Будете ли Вы пользоваться видеоэкраном?

Да. Нет. Наберите на клавиатуре соответствующий ответ.

В

Вам объяснить как пользоваться программой? Да. Нет. Наберите на клавиатуре соответствующий ответ.

Г

При поиске распознаются те слова, которые содержат не более семи букв. Слова, содержащие более семи букв, расчленяются, но не в коем случае не сокращаются. Например, слово «механизация» будет найдено, если в запросе оно будет состоять из двух частей «механи» и «зация». Термины запроса при вводе печатаются по одному в строке. Связка «и» печатается на отдельной строке и отделяет новую группу терминов. «нет» исключает следующую за ней группу. «Конец» указывает на окончание процедуры ввода. Термины внутри групп связываются с помощью «или».

Д

Печатать слова?

Е

Корова

Или

Коровы

Или

Коров

И

Поение

И

Кормление

И

Доение

Или

Рацион

Или

Рационы

И

Крупный

И

Скот

«Конец»

Ж

Будут выданы те заголовки, которые содержат следующие комбинации, перечисленные в Е.

И

Найдено (число библиографических описаний документов).

К

Вы хотите посмотреть найденные библиографические описания? Да. Нет. Наберите на клавиатуре дисплея соответствующий ответ.

Л

Вы желаете продолжать поиск, усовершенствовать запрос или начать снова? Да. Нет. Наберите на клавиатуре дисплея соответствующий ответ.

Нет.

Конец.

Из приведенного примера отчетливо видно, что то время, которое потребитель затратил на беседу с ЭВМ и обозревал представленную библиографическую информацию в виде описаний, программа прервала работу ЭВМ и, когда она находилась в состоянии ожидания команды, была подключена вторая и так далее программы поиска информации.

Принципиальная схема диалоговых информационных систем представлена на рисунке 3.4.

Чтобы наиболее рационально использовать машинное время, повысить эффективность эксплуатации ЭВМ, увеличить ее производительность необходимо снизить абсолютные затраты времени на поиск. Затраты времени на поиск складываются из общего времени, истекшего с момента подачи запроса до момента получения результатов – с одной стороны, и времени работы процессора – с другой. Для того, чтобы загрузить работой процессор используется метод пакетной или групповой обработки информации. Для того, чтобы реализовать метод групповой обработки применяют мультипрограммирование. Под мультипрограммированием понимают такой способ организации работы электронно-вычислительной машины, когда ЭВМ обеспечивает одновременное выполнение нескольких программ. Для пакетной обработки данных важным аспектом поиска информации в массиве является число запросов, иначе говоря, такой упорядоченный набор поисковых предписаний, который позволяет одновременно или почти одновременно осуществлять поиск по всему «пакету» информационных запросов. Например, на магнитной ленте записан алфавитный каталог библиотеки. Как известно, в алфавитном каталоге библиографические описания упорядочены в строгом алфавите. В таком информационном массиве требуется отыскать библиографические описания на документы следующих актеров: Жукова Г. К., Арбузова Г. А., Терентьева М. И., Фатьянов К. М. По всей вероятности, наиболее экономичным будет поиск в том случае, если требуемая информация будет предварительно упорядочена в алфавите: Арбузов Г. А., Жуков Г. К., Терентьев М. И., Фатьянов К. М. Такое упорядочение позволяет осуществлять последовательное считывание информации на магнитной ленте. Перемотка магнитной ленты не требуется.

Связь пользователя (абонента) с ЭВМ в настоящее время осуществляется с помощью различных устройств, в том числе: телетайпов, телефона (выбора цифровых кодов) и дисплеев. Скорость работы перечисленных устройств ограничена и составляет от десяти до тридцати символов в секунды. В терминалах с дисплеем скорость ввода и вывода может быть доведена до трехсот символов в секунду. Перечисленные средства связи с ЭВМ предназначены главным образом для передачи коротких сообщений. В практике же работы служб информации приходится передавать большие объемы информации, включая полные тексты документов. Для того, чтобы обеспечить оперативную выдачу информации в больших объемах, включая тексты документов в качестве выводного механизма используют быстродействующие печатающие устройства, которые выводят информацию (печатают) до двух тысяч строк в минуту. Если такие термины как телефон, телетайп, дисплей обычно удалены на большие расстояния от ЭВМ, то высокоскоростные печатающие устройства обычно располагаются рядом с ЭВМ.

В тех случаях, когда потребителю требуются значительные объемы записей (десятки и сотни страниц) лучше всего использовать высокоскоростные печатающие устройства и получать результаты поиска информации путем пересылки по почте.

Наилучшим вариантом накапливания, хранения поисковых массивов и самих документов в автоматизированных ИПС считается накапливание и хранение их в виде микрофильмов.

В этой связи все шире и шире в качестве носителя информации в автоматизированных ИПС используют микроносители. Микрофильмовая техника приобретает весьма важное значение при реализации АИС потому, что средства микрофильмирования с одной стороны сокращают объемы хранения документов в системах, с другой стороны, обеспечивают автоматизацию процессов копирования документов.

При проектировании АИС в качестве подсистемы (активного запоминающего устройства) разработчики предусматривают использование дисмикрокарт, микрофиш. Во многих АИС, которые не используют микроносителей поисковые образы документов и сами документы хранятся раздельно. И в этих системах обычно производится два поиска: поиск адресов и поиск самих документов. Такая процедура усложняет выдачу документов, удлиняет сроки обслуживания. Микроносители позволяют объединить вместе поисковый образ и сам документ. АИС, реализованная на микрофильмах использует как дискретные, так и непрерывные носители информации. К дискретным носителям информации относятся рулонные микрофильмы, к дискретным – микрофиши. Блок-схему АИС, реализованной на микроносителях см. на рис.

В наше время находят применение видеомагнитные карты. В диалоговых АИС они обеспечивают передачу изображения на экран дисплея.

В будущем экономически эффективным будет использование телевидения для передачи изображения текстов книг, чертежей, схем и т. д. Пока из-за дороговизны каналов передачи (связи) применение телевидения ограничено.


Автоматизированные библиотечно-библиографические системы.

Библиотека (централизованная библиотечная система) представляет собой совокупность блоков, подсистем. При этом каждый блок системы выполняет свою специфическую функцию. Библиотека нами рассматривается как документальная поисковая система. Здесь мы укажем на некоторые специфические особенности функционирования автоматизированных библиотек и их будущее. Библиотека имеет не только внутренние, но и внешние сложные связи. (см. рис. ). Задача любой библиотеки (библиотечной системы) состоит в том, чтобы, используя все методы и формы работы, присущие библиотеке поставить на службу отечества те сведения, которые заключены в документальных фондах.

Известно, что каждый документ содержит как концептографическую, так и фактографическую информацию. Чтобы использовать информацию, заключенную в документе, библиотеки, исходя их требований общественной практики, выработали методы, разработали формы работы с различными видами изданий.

Чтобы документ мог функционировать (работать) в библиотеке (некоторой коллекции) его подвергают процедуре, которая называется в библиотеках обработкой, в процессе которой документ проводит процедуру идентификации, т.е. документу приписывают такие характеристики, которые отмечают данный документ от ему подобных. В библиотечной практике широкое применение для идентификации нашел метод библиографического анализа и синтеза. Процедура отторжения элементов от документа и их синтезирования в виде поискового образа в библиотеках называется каталогизацией (библиографическое описание документа и его классификация).

Библиотеки накопили огромные документальные фонды, создали разветвленную систему справочного аппарата, выработали и освоили целый арсенал форм и методов раскрытия содержания документов с учетом их видов и типов. Формы работы с документами, которые применяются в библиотеках ориентированы главным образом на ручные (традиционные) методы работы с ними. Все вместе взятые затруднения и усложняет внедрение в практику работы библиотек средств вычислительной техники. В существующей технологии «путь книги», «путь библиографической справки», «путь требования на книгу» ориентированы на ручные методы работы.

Внедрение электронно-вычислительных машин для механизации и автоматизации технологических процессов потребует коренным образом пересмотреть технологию ввода документов в библиотечную систему, отказаться от сложившихся приемов и методов работы с книгой. Приспосабливать ЭВМ к существующей технологии не только затруднительно, малоэффективно, но и нецелесообразно. Внедрение ЭВМ потребует всего отказа от существующей технологии. Отдельные технологические операции необходимо существенно изменить, таким образом, чтобы они вписывались в машинную технологию. Существует и другая точка зрения – приспособить существующую технологию к машинной обработке, т. е. автоматизировать те технологические процессы и операции, в принципе не нарушая общей технологии.

Внедрение средств автоматизации в практику работы библиотек должно быть не самоцелью, а средством, обеспечивающим новый качественный скачок в библиотечно-библиографическом обслуживании ученых и специалистов. В немалой степени при внедрении средств вычислительной техники будут играть и технико-экономические показатели работы автоматизированных библиотек.

Рассматривая структуру автоматизированных библиотек, надо заметить тот факт, что эта структура в принципе ничем не отличается от структуры автоматизированных документальных информационно-поисковых систем. Здесь мы укажем только на некоторые отличительные особенности функционирования отдельных подсистем автоматизированных библиотек. Одной из подсистем является подсистема управления комплектованием документальных фондов. Так, например, функционирование автоматизированных подсистем комплектования фондов во всесоюзных библиотечных центрах (которые получают обязательный бесплатный экземпляр всех изданий) будет организовано несколько иначе, чем республиканских, областных научных библиотеках, централизованных, библиотечных системах. Для этой группы библиотек отличительной особенностью является то, что сложившаяся практика принятия решения о приобретении конкретного документа (книги) для библиотеки или библиотечной системы сводится не только к формальному акту оформления заказа и отсылке его поставщику с последующим контролем о выполнении заказа, но и требует для принятия решения достаточно полной и надежной информации, а именно: определить степень соответствия содержания документа таматико-типологическому плану комплектования библиотечных фондов, определить количественный и качественный уровень укомплектованности конкретного тематического направления которому по содержанию относится приобретаемый документ; а также определить, нет ли в фонде библиотеки соответствующих стереотипный или повторных изданий; оценить степень соответствия тематико-типологическому плану формирования фондов, который определен координационным планом между библиотеками города, области, региона. Для того, чтобы принять решение о приобретении документа, по-видимому, управляющему органу или лицам, осуществляющим комплектование фондов небезразлично знать с какой интенсивностью затрепываются читателями документов из отделов (тематического направления), к которому принадлежит документ; имеются ли аналогические документы по данному тематическому направлению в обменных фондах, и, наконец, исходя из финансовых возможностей, при приобретении книги необходимо учитывать критерий приоритетности по тематике, видам, типам литературы.

Для того, чтобы обеспечить реализацию задачи по приобретению документального фонда при соблюдении перечисленных требований в условиях областной научной библиотеки, где объемы комплектования составляют ежегодно 35-40 тыс. названий, 100-110 тыс. экземпляров, а объем книговыдачи составляет 1,5 млн. потребуется увеличить штатную численность работников отдела комплектования в 15 раз.

Решения задачи управления формированием документальных фондов с использованием средств вычислительной техники приобретает государственное значение еще и потому, что больше половины учетных единиц документальных фондов в условиях областных библиотек не запрашивается.

Внедрение автоматизированных подсистем управления комплектованием библиотечных фондов может быть реализовано на основе файлов информационных массивов, которые подговаривает и выпускает в виде магнитоленточных изданий автоматизированная система сводного тематического планирования и координации выпуска литературы (АС СТПК) Госкомиздата. АС СТПК в настоящее время ежемесячно издает магнитные ленты пока по трем разделам: общественно-политическая, научно-техническая и художественная литература. Содержанием магнитных лент является описание планируемых к выпуску изданий. Помимо сведений библиографического характера магнитные ленты содержат аннотации, данные о типе, коды издательств, номера изданий в тематическом плане издательства. Централизованная подготовка магнитных лент АС СТПК, а также пакет прикладных программ математического обеспечения создают реальные возможности для создания в условиях работы республиканских и областных научных библиотек и территориальных ЦНТБ АСУ комплектованием документальных фондов.

По-видимому, прямое перенесение и внедрение накопленного опыта функционирования АС СТПК Госкомиздата не может быть реализовано. Однако опыт функционирования АС СТПК и ее магнитоленточные издания не только могут использоваться для автоматизации процесса комплектования фондов, но также для оповещения читателей о выходящей литературе по профилю читателей. В частности должны быть доработаны или вновь разработаны задающие тематический профиль комплектования программы, обеспечивающие реализацию сопоставления тематико-типологического плана библиотеки с массивами информации магнитоленточных изданий АС СТПК. Для этих целей, как нам кажется, необходимо разработать таблицы соответствия между индексами тематико-типологического плана, которые задаются цифрами Универсальной Десятичной классификации в научно-технических библиотеках и советской библиотечно-библиографической классификацией, с индексами единой схемы классификаций литературы для книгоиздания в СССР.

Для комплектования периодических изданий можно воспользоваться магнитоленточными изданиями международной автоматизированной системы регистраций периодических изданий стран членов МЦНТИ.

В принципе АС СТПК Госкомиздата может служить прототипом для разработки АСУ комплектования библиотечных фондов.

Автоматизированные подсистемы избирательного распространения информации, книгообмена, читатели, библиотечные кадры, сводные каталоги, МБА будут рассмотрены в главе «Функциональная и организационная структура АИС».


ФУНКЦИОНАЛЬНАЯ И ОРГАНИЗАЦИОННАЯ СТРУКТУРА АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ.

  1. Основные функциональные подсистемы. Подсистема сбора информации


Сбор – процесс получения информации из различных источников для обеспечения какой-либо работы (научно-последовательной, опытно-конструкторской, общественной).

В подсистему сбора информации входят и процессы выявления различных источников, которые содержат информацию, соответствующих профилю формирования информационных массивов. Под источниками комплектования фондов понимаются различного рода материалы, на основании изучения которых может быть выявлено наличие или существование необходимых для функционирования АИПС документов, а также возможности и пути их приобретения. Например, к таким материалам относятся тематические планы издательств, библиографические пособия, промышленные каталоги, нормативно-техническая документация и т. п., а также источники комплектования вторичными документами, включая магнитоленточные издания. Различают два понятия: «источники информации для комплектования фондов» и «источники комплектования фондов». Под источниками информации для комплектования фондов понимаются организации, учреждения, обладающие необходимыми для фонда документами и постоянно снабжающие подсистему сбора этими документами. К ним относятся такие организации как библиотечные коллекторы, книготорговые предприятия и учреждения, которые осуществляют распространение изданий по подписке или иным способом. Документы, которые содержат библиографическую, концептографическую, фактографическую информацию и подлежат вводу в АИС, обычно подразделяют на две группы документов: первичные и вторичные.

К группе первичных документов относятся следующие виды изданий: книги, журналы, сборники, официальные и ведомственные издания, которые обычно публикуются от имени учреждений, организаций, министерств и ведомств, а также специальные виды технических изданий, стандарты, технические условия, другие виды нормативно-технической информации, например, описания на изобретения к авторским свидетельствам и патентам. Одним из критериев оценки функционирования АИПС, как известно, является оперативное оповещение о последних достижениях науки, техники и передового производственного опыта. Поэтому не случаен тот интерес, который проявляют сотрудники подсистемы сбора информации к выявлению и получению еще не опубликованных документов – отчетов по завершенным научным исследованиям, проектным разработкам, командировкам за границу, а также информационных картах о передовых научно-технических достижениях на производстве; экономической информации и авторефератам диссертаций. Каждый из видов упомянутых первичных документов имеет свою специфическую структуру. Изучение и твердое знание структуры информации в документе позволяет быстрее отыскать, выделить ту часть, те элементы, которые позволяют с наибольшей вероятностью разыскать документ в массиве (библиотеке). Определение и оценка параметров документального потока с учетом его видовой структуры необходимы для технико-экономического обоснования, выбора и оценки технически средств, которые задействованы не только в подсистеме сбора, но и в подсистеме обработки информации.

Вторичными документами называются документы, подготовленные в ходе аналитико-синтетической обработки и преобразования первичных документов в виде аннотации, реферата, обзора и т. д. К вторичным документам относятся энциклопедии, обзоры, реферативные журналы, библиографические указатели, каталоги, картотеки и т. п.

Известно, что многие автоматизированные документальные информационно-поисковые системы, имеющие международное, национальное отраслевое и локальное значение ведут информационное обслуживание на базе вторичных документов. Вторичные документы, как введенные, так и не введенные в систему уже сами по себе упрощают и ускоряют семантический анализ содержания первичного документа. Во вторичном документе присутствуют все обязательные библиографические элементы с одной стороны, а с другой стороны во вторичном документе присутствуют такие элементы (ключевые слова, дескрипторы и т. п.), которые раскрывают содержание документа. Эти элементы являются вполне достаточными, чтобы не только найти документ, но, и принято решение о дальнейшем ознакомлении с оригиналом или копией документа. Считается обычным тот факт, что в автоматизированные ИПС вводят вторичные документы, которые не обеспечены в системе оригиналами или их копиями. Расценивать сам по себе этот факт, как отрицательное явление при функционировании АИС нельзя. Правда, в этом случае удлиняются сроки обслуживания потребителя. На основании оценки количественных и качественных параметров первичного и вторичного потоков можно судить не только о входной и выходной информации, но и определить основные формы информационных услуг, которые может представить автоматизированная информационно-поисковая система.


Подсистема обработки информации


Под обработкой информации подразумевается совокупность процедур или различных действий, производимых над поступающей или собранной информацией, приводящей к тому или иному изменению вида или характера представления информации.

В подсистеме обработки информации документ проходит как техническую, так и научную обработку, т. е. подвергается действиям, связанным с подготовкой документа для его размещения, хранения в сложной структуре информационных массивов. Надо заметить, что в настоящее время практически все автоматизированные информационно-поисковые системы документального типа задачу информационного поиска осуществляют по двухконтурной схеме, т. е. в начале АИС выдает в ответ на запрос адрес хранения с библиографическим описанием (рефератом, аннотацией), а затем по запросу потребителя выдаются сами документы или их копии. Поэтому не случайно в АИС все документы, которые должны быть введены в систему, проходят стадию документального описания. Документационное описание – это, по-существу, выделение совокупности сведений о документе, выраженных в текстовом виде и характеризующих сам документ, его форму, содержание и т. д. Описание документа в АИС обычно представляется в виде заголовка, предметного слова (дескриптора, библиографического описания, аннотации, реферата).

Применяемые методы документального описания позволяют, во-первых, по библиографическим характеристикам отыскать любой документ в массиве и установить место его хранения, во-вторых, при снабжении библиографического описания документа аннотацией, рефератом у потребителя появляется возможность принятия решения о том, нужно ли ему знакомиться с содержанием документа, в документальном описании важнейшую роль, с точки зрения раскрытия предметного содержания документа, играет индексирование. Под индексированием понимается процесс выделения из текста документов некоторых лексических единиц (слов, словосочетаний, тематических и предметных рубрик и т. п.), раскрывающих содержание документа с последующим переводом выделенных лексических единиц на информационно-поисковый язык АИС. Процедура перевода выделенных лексических единиц с естественного языка на язык АИПС осуществляется обычно по схеме тождественного и нетождественного перевода.

Для схемы тождественного перевода характерным является то, что выделенные лексические единицы как по форме, так и по содержанию совпадают с лексическими единицами ИПЯ, т. е. они эквиваленты. Для нетождественного перевода лексических единиц с естественного языка на язык ИПС характерным является тот факт, что выделенные лексические единицы из текста документов и запросов совпадают с лексическими единицами ИПЯ не по форме, а по содержанию.

При индексировании документов главным объектом анализа является текст самого документа. В результате анализа текста документа преследуется следующие цели: 1) выявление центральной темы или предмета в документе, 2) определение насколько документ по своему семантическому содержанию соответствует интересам определенных социальных групп (ученых, специалистов и т. д.). В результате документационного описания, в процессе синтеза выделенных элементов должен быть получен поисковый образ документа.

Для обеспечения исчерпывающей аналитико-синтетической переработки документов с целью его ввода в интегральные автоматизированные ИПС в подсистеме обработки для лучшей организации работ, связанных с подготовкой документа к вводу в систему применяют специальные формуляры (предмашинные рабочие листы), которые заполняются специалистами. В формулярах отведены специальные места для библиографического описания документа, реферата и т. д. Заполненные формуляры редактируются и служат исходным документом для ввода данных в ИПС. Обычно формуляр содержит следующие сведения: рабочий номер документа; сведения о виде документа (монография, отчет, статья, описание изобретения, промкаталог, Гост, ТУ и др.); полное библиографическое описание; классификационные индексы рубрикаторов международной системы НТИ, ГАСНТИ, УДК, ББК, МКИ; классификаторов промышленной и сельскохозяйственной продукции, государственных стандартов; а также список индексирующих документов дескрипторов, ключевых слов; реферат. Перечисленных сведений вполне достаточно для того, чтобы используя ЭВМ, автоматизировано подготовить любой вид информационного издания (РЖ, СИ, ретроспективные указатели, а также осуществлять информационное обслуживание в системе ИРИ. Как известно, ввод данных в АИС осуществляется с машиночитаемых носителей информации (перфолент, магнитных лент и т. п.), с так называемых промежуточных носителей. Исходным документом о записи информации на магнитную ленту любых АИС является предмашинный рабочий лист ПРЛ (см. рис. ). Последовательность и запись информации на предмашинном рабочем листе осуществляется в соответствии с требованиями ГОСТа 7.14-78. Коммуникативный формат. Структура библиографической записи элементов данных на магнитной ленте. Общая структура записи представлена на рис.

Маркер записи

Справочник

Поля данных (включая разделители полей)

Разделители библиографических полей

Маркер записи является полем фиксированной длины, находится в начале записи и содержит параметры, необходимые для ее обработки.

Справочник – совокупность переменного числа полей, фиксированной длины, называемых статьями, каждая из которых идентифицирует соответствующее поле данных.

Поле данных имеет переменную длину и является частью библиографической записи, содержащей определенную категорию данных. Каждое поле отделяется друг от друга разделителем поля.

Разделители поля должны находиться в конце каждого поля переменной длины. Записи элементов одного документа от записей другого документа отделяются разделителем записи. Разделители записи поставляются после последнего разделителя поля.

Библиографические поля содержат информационные данные об описываемых библиографических единицах.

Библиографическое поле может содержать подполя, каждое из которых включает определенную единицу информации.

Записи, которые включают определенную смысловую единицу информации и доступ, к которым надо осуществить отделяются метками, индикаторами, идентификаторами.

Элементы данных библиографической записи кодируются в соответствии со стандартом СЭВ. 356-76. или стандартом СЭВ. 358-76 (таблица КОИ-8) (см. рис. ).

ГОСТ 7.19-79 Наполнение коммуникативного формата. Регламентирует наполнение коммуникативного формата библиографической записи и распространяется на книги, сериальные издания, документы научно-исследовательских и опытно-конструкторских работах, диссертации, патентные и нормативно-технические документы, каталоги промышленного оборудования и изделий, неопубликованные переводы научно-технической литературы, рецензии и рефераты. Стандарт обязателен к применению всеми организациями, участвующими в обмене информации между автоматизированными системами. Пользуясь детальной структурой библиографической записи (см. рис. ), а также наименованием элементов данных и их статусом записи (см. рис. ), относительно легко можно разработать правила и порядок заполнения полей предмашинного рабочего листа. Подготовку предмашинных рабочих листов на документы, подлежащие вводу в АИПС, осуществляют как головные информационные центры бах данных, так и органы информации, которые участвуют на кооперативных началах по созданию этих баз.

Базой данных называются любые соответствующим образом упорядоченные и записанные на машиночитаемые носители информации библиографические или фактографические сведения, обычно относящиеся к одной отрасли, проблеме, предмету и предназначенные для эксплуатации в автоматизированных ИПС.

Информационные издания на машиночитаемых носителях информации (магнитоленточные издания) обычно называют базой данных. Совокупность баз данных (упорядоченных записей на машиночитаемых носителях информации) называют банком данных АИС.

В практике работы информационных центров, ведущих информационное и библиографическое обслуживание ученых и специалистов базам данных присваивают наименование. Обычно эти наименования совпадают с названиями информационных изданий, например, РЖ. «Горное дело» (сборник НИР и ОКР «Горное дело»).

В таких автоматизированных системах, где используются в качестве элементов информации библиографические сведения, структура записи на носителях легко укладывается в регламент требований, определяемых ГОСТами 7.14-78 и 7.19-79. принципы и структура построения баз данных в автоматизированных фактографических ИПС является более сложной чем в документальных. Здесь мы укажем только на общие принципы и общую структуру организации баз данных фактографических АИС. В последние годы резко возросли объем и сложность обрабатываемых и используемых фактографических данных и все зримее проступают контуры мощных вычислительных центров коллективного пользования, которые позволяют работать электронно-вычислительным машинам с разделением времени, развитой сетью терминалов, обеспечивающих пользование ЭВМ большому числу потребителей. Все это, вместе взятое (большие объемы и сложность обработки информации, ИВЦ коллективного пользования) приводит в противоречие со сложившейся традицией создание и использование в системах узкоспециализированных фактографических баз данных, рассчитанных на небольшую группу специалистов. В системах, ориентированных на обслуживание узкоспециализированных фактографических запросов, как правило, осуществлялась подготовка, хранение информации децентрализовано, что в свою очередь приводило к многократному дублированию данных в системах, ухудшались экономические показатели функционирования фактографических АИС, а также усложнялось использование накопленных данных в различных системах. Затруднение в использовании баз данных в таких системах главным образом связано с многообразием обрабатывающих программ и, как правило, обрабатывающие программы жестко связаны со «своими» информационными массивами.

Сложные управленческие и научно-технические задачи обычно относятся к классу динамических задач, в которых сложная совокупность объектов рассматривается различными группами тематически взаимосвязанных информационных массивов. Вместе с тем пользователям этой информации приходится решать управленческие задачи об объекте с различных точек зрения, при этом точки зрения логически взаимоувязаны. Надо заметить, что создаваемая и хранимая фактографическая информация (базы данных) со временем существенно меняется.

Для того, чтобы обеспечить некоторый уровень информационного и справочно-библиографического обслуживания пользователей баз данных АИС фактографического типа выдают часть хранимой информации указанной в запросе. Более специализированный уровень выдачи фактографической информации в АИС связан с конкретизацией критериев смыслового соответствия, который задается в системе. Интерпретация данных, способы содержательного описания данных входят в компетенцию пользователя. Структура данных в автоматизированных банках фактографической информации должна быть простой и достаточно хорошо обозримой. Структурные элементы единиц данных должны быть снабжены иерархическими и неиерархическими отношениями. В базах фактографических данных представленных различными типами структур (элемент, группа, групповое отношение, статья, файл, база данных) существуют следующие внутренние отношения:

Структура

Составляющие

Элемент

Не имеет

Группа

Элемент, группа

Групповое отношение

Группа

Статья

Группа, групповое отношение

Файл

Статья, групповое отношение

База данных

Файл, групповое отношение

Элементы, как видно из приведенной структуры, не имеют составляющих. Они являются элементарными, логически неделимыми структурами данных, которые, в конечном счете, составляют сложные структуры всех основных типов. Группа – совокупность элементов (это простая группа) и совокупность как элементов, так и групп (составная группа) (см. рис. ).



А) простая группа


СТАТЬЯ – это совокупность групп или групповых отношений, в которых одна и только одна группа не содержится (не подчиняется другой группе). Совокупность статей образует файл, причем для статей могут быть указаны отношения, - файл со связями, там где не указаны – файл без связей. Совокупность различных типов структур фактографических АИС образует базу данных.