Учебное пособие для студентов библиотечного факультета Кемерово 1981 г

Вид материалаУчебное пособие

Содержание


Дескрипторная статья
Программное обеспечение
Информационное обеспечение автоматизированных информационно-поисковых систем
Отечественные отраслевые автоматизированные информационно-поисковые системы
Подобный материал:
1   2   3   4   5   6   7   8   9

Дескрипторная статья


Селен 006767

Р.Д.Катализаторы

Металлические 002726

Р.Д.Ускорители

Вулканизации 010311

Р.Д.Вулканизация 001201


Дескриптор «Селен» с его шифрами, а также с шифрами родовых дескрипторов с метками о наличии родовых и ассоциативных дескрипторов будет записан в ячейке памяти ЭВМ.

Для иллюстрации процедур ввода в ЭВМ подготовленного информационно-поискового тезауруса приводим словесное описание алгоритма программы «ввод словаря в память ЭВМ».

Указания:

1) Чтение кода с перфоленты, запись ее в рабочую ячейку (n), перейти к пункту 2;

2) сравнить содержание ячейки (n) с кодом («латинский»), записанным в ячейки (n+15), если n равно (n-15), перейти к пункту 3; если n равно (n+15), перейти к пункту 1;

Примечание. Кодом «латинский регистр» забиваются ошибки, допущенные при записи информации на перфоленту;

3) сравнить содержание ячейки (n) с признаком метки «конец слова», если (n) не «конец слова», перейти к пункту 4;

если (n) – «конец слова» - перейти к пункту 6;

4) записать содержимое (n) в рабочую ячейку (n+1);

если (n+1) заполнено, перейти к пункту 5;

если (n+1) не заполнено, перейти к пункту 1;

5) изменить содержание команды пункта 4, увеличив номер рабочей ячейки на единицу и перейти к пункту 1;

6) сравнить содержимое ячейки (n+1) с признаком «конец ввода», если (n+1) – «конец ввода», перейти к пункту 15, если (n+1) – не «конец ввода», перейти к пункту 7;

7) записать дескрипторы из рабочих ячеек в зону, отведенную для записи информационно-поискового тезауруса, перейти к пункту 8.

Примечание: после записи дескрипторного словаря в зоны процесса автоматизации, кодирование информации начинается с пункта 8 (аналогично пункту 1);

8) чтение кода с перфоленты, запись его в рабочую ячейку (n), перейти к пункту 9;

9) сравнить содержимое ячейки (n) с кодом «латинский», записанным в ячейке (n-15), если (n) равно (n-15) – перейти к пункту 8, если (n) равно (n+15), перейти к пункту 10.

10) Записать код из ячейки (n) в первую рабочую ячейку (n+1), если (n+1) заполнено перейти к пункту 11, если (n+) заполнено, перейти к пункту 8;

11) Сравнить с признаком «есть» родовой дескриптор, если родовой дескриптор есть, перейти к пункту 12, если родового дескриптора нет – перейти к пункту 13.

12) Изменить адрес в пункте 10, увеличив номер рабочей ячейки на одну, перейти к пункту 8.

13) Записать шифры дескрипторов в ячейки зоны, отведено для записи информационно-поисковой тезауруса. Шифры записывают в ячейки следующей за дескриптором, перейти к пункту 14.

14) Подготовка команда для записи следующего дескриптора, очистить рабочие ячейки, перейти к пункту 15;

15) Остановить работу программы, записать зону словаря на магнитную ленту, перейти к записи новой зоны словаря, начать работы сначала.

Изложив общие принципы представления информации в вычислительных системах, а также использования различных систем счисления для решения различных арифметических и логических задач в вычислительных машинах, а также ознакомив с общими принципами задания алгоритмов для ЭВМ, мы преследовали цель стимулировать желание студента овладеть основами программирования, иметь представление об алгоритмических языках и четко представлять себе, что решение задач по информационному поиску в массивах связано со строгим, четким однозначным словесным описанием алгоритмов информационных задач и преобразования словесного описания алгоритма на язык блок-схем, задания алгоритмов информационных задач для решения в ЭВМ является прерогативой специалиста – библиотекаря-библиографа.


Программное обеспечение


Программное обеспечение современных вычислительных систем включает алгоритмические языки, языки программирования с соответствующими компилирующими системами. Кроме этого в программное обеспечение входит операционная система, которая осуществляет общую организацию процесса обработки информации, а также обеспечивает связь ЭВМ с пользователем. Обслуживающая система матобеспечения предназначается для отладки, контроля и диагностики неисправностей работы ЭВМ. Классификационная схема программного обеспечения представлена на рис.




Не разбирая всю совокупность программ, которые обеспечивают эффективное функционирование автоматизированных информационно-поисковых систем, обратим внимание на то, что кроме общего есть специальное программное обеспечение, которое обычно состоит из комплекса программ, добавляемых к общему программному обеспечению и чаще всего называемых пакетом прикладных программ. Они включаются в программное обеспечение вычислительной системы и обеспечивают функционирование ЭВМ или комплекса машин, которое ведут специализированную обработку информации. Для пакета прикладных программ (ППП) характерной особенностью является то, что они ориентированы на сравнительно небольшой круг решаемых задач, но при этом во всем их разнообразии. Так, например, в состав программного обеспечения АИС МЦНТИ включено более 77 программ, призванных обеспечить весь комплекс обработки информации, включая процессы сбора, индексирования, поиска информации в рабочих массивах, процессов ведения информационно-поисковых языков, статистической обработки потоков информации, а также подготовки оригинал-макетов подготовки информационных изданий. В пакете прикладных программ АИС МЦНТИ имеется программа, которая обеспечивает связь оптического читающего устройства с ЭВМ, для автоматизации процессов записи информации на магнитные ленты. Пакет прикладных программ разработан комбинатом «РОБОТРОН» (ГДР) специально по заказу МЦНТИ содержит комплекс программ, специально предназначенных для автоматизации индексирования документов. Основной пакет прикладных программ АИДОС включает программа для автоматизации практически всех основных процессов ввода, накопления, поиска и выдачи информации. Пакет программ АИДОС может быть использован практически для решения всех информационных задач в документальных и фактографических автоматизированных системах.

В настоящее время, как правило, поставщики электронно-вычислительных систем вместе с поставкой ЭВМ включают и поставку прикладных программ, предназначенных для решения типовых задач в области научных исследований, инженерно-экономических расчетов и решения других задач. К программному обеспечению предъявляются следующие требования:
  • Совместимости. За счет этого можно между вычислительными центрами наладить взаимный обмен программами, данными, массивами. Совместимость программного обеспечения достигается за счет стандартных программ, команд, а также за счет логических и физических уровней ввода и вывода.
  • Модульности структуры программного обеспечения. Это означает то, что как бы ни была сложна и громоздка система математического обеспечения ее можно разделить на отдельные части. Модульность структуры математического обеспечения упрощает разработку отдельных частей программы, ее можно поручить разным лицам. В математическое обеспечение в этом случае можно вносить дополнения, изменения.
  • Система программного обеспечения должна быть гибкой. Это значит, что она может быть применена для обработки информации в любой сфере деятельности.

Завершая изложение раздела «Программирование и математическое обеспечение информационных задач», укажем, что для автоматизации программирования широкое применение нашли алгоритмические языки «АЛГОЛ», «КОБОЛ», «ФОРТРАН», «ПЛ/1» и др. Изучение алгоритмических языков, которые используются при программировании информационных задач – сущность другой дисциплины.


Информационное обеспечение автоматизированных информационно-поисковых систем


Для того, чтобы обеспечить надежное информирование ученых, специалистов и новаторов производства АИС должны располагать надежной базой данных с постоянным их пополнением и исключением из этой базы всей устаревшей информации. Качественные и количественные параметры, информационные базы АИС характеризуются не только отраслевой, тематической направленностью информационного потока, но видовой, а также типологической структурой потока входной информации. Качественные и количественные характеристики информационного потока на входе в систему, зависят от задач и функций, которые возложены на информационные центры в зависимости от места, которое он занимает в иерархии единой государственной системы НТИ. В информационную базу АИС включаются как первичные, так и вторичные документы. Видовая структура первичных документов на выходе в систему представлена официальными инструктивными, директивными документами, книгами и брошюрами, периодическими и продолжающимися изданиями; патентной и нормативно-технической документации; промышленными каталогами, прейскурантами и ценниками; непубликуемой научно-технической документацией, переводами, диссертациями, депонированными рукописями и препринтами.

Библиографические карточки, аннотированные и реферативные карточки отраслевых, межотраслевых, всесоюзных информационных и библиотечных центров составляют информационный поток вторичных документов. Поток вторичных документов включает информационные карты на чертежно-конструкторскую документацию, на нестандартное оборудование, а также карты с описанием технических новшеств, внедренных в производство.

В связи с развитием сети АИС появились возможности взаимного обмена базами данных между ними, и информационный поток стал включать машиночитаемые носители информации, предмашинные рабочие листы, бланки для оптического считывания информации и т.д.

Информационный поток на входе в АИС по степени пригодности к использованию можно разделить на три группы:
  • Документы, пригодные для использования только человеком (это самая большая по объему группа документов, она характеризуется большим разнообразием как по форме исполнения, так и по композиции, заключенной в них информации. Для этой группы документов характерным является то, что они без предварительного преобразования не могут быть использованы в современных вычислительных системах).
  • Вторую группу документов представляют промежуточные носители информации: магнитные ленты, магнитные диски и перфоносители. Такая форма представления информации весьма удобна для ввода в ЭВМ, но как правило не может быть использована человеком без специальных простых и сложных декодирующих устройств.
  • И наконец, третья группа документов, которые включаются в информационное обеспечение, может быть легко, без особых усилий использовано как в ЭВМ, так и человеком. Такой вид документов прежде всего представлен бланками для считывания, оптическими устройствами со стилизованными текстами, а также картами с магнитной полоской, графическим отметками (см. рис.).

Общественная практика не только выработала, но и приспособила все многообразие структурных документов, которые наилучшим образом могут и решают задачи, связанные с поиском, анализом и синтезом семантической информации в документальных и фактографических традиционных информационных системах.

Если в традиционных ИПС допускается некоторая свобода структурирования элементов информации в документах, то использование документов АИС со свободным структурированием не только усложняет работу системы, но и в отдельных случаях делает ее невозможной. Все огромное разнообразие знаковых систем, которые используются в естественных языках, языках программирования, языках физической, химической, математической символики, единиц измерения, вместе взятая, достаточно хорошо иллюстрирует сложность задачи разработки информационной технологии, последовательность ее развития, а также использование правил индексирования документов с использованием всего комплекса информационно-поисковых языков входящих в систему лингвистического обеспечения. Разнообразие форм представления документов, сложность их структуры, различие в элементах информации усложняет решение задач совместимости систем, затрудняет установление между ними взаимосвязей кооперирования и интеграции усилий между информационными партнерами.

К информационному обеспечению АИС относится не только поток входной информации, но и поток выходной информации. В автоматизированных информационных системах интегрального типа выходной информационный поток характеризуется следующими формами информационного сервиса: реферативные журналы, бюллетени сигнальной информации со всевозможными вспомогательными указателями, система ИРИ, подготовка ответов на разовые запросы потребителей с выдачей первичных и вторичных документов, предоставление потребителям копий документов, а также предоставление пользователям АИС магнитоленточных изданий.

Применение ЭВМ при обработке информационного потока на первом этапе эксплуатации АИС позволило не только автоматизировать отдельные операции, но и отработать информационную технологию по преобразованию информационного потока в машиночитаемую форму; выработать общие подходы к размещению элементов информации на магнитных носителях и закрепить этот порядок на уровне государственного стандарта; создать предпосылки к организации взаимного обмена базами данных на магнитных лентах. На втором этапе развития АИС, когда информационная технология реализовывалась на совместимость ЭВМ (ЕС ЭВМ), это позволило приступить с учетом уже накопленного опыта автоматизации информационных процессов не только к обмену базами данных, но и распространению магнитоленточных изданий. Так, например, ВИНИТИ распространяет следующие базы данных реферативной информации на магнитных лентах: по автоматике и телемеханике, вычислительной техники и электроники, электросвязи и информатики. ВИНИТИ выпускает на магнитных лентах сигнальную информацию по автоматике и телемеханике, металлургии, горному делу, биологии и химии. Магнитоленточные издания ВНТИЦентро охватывают отрасли знания: марксизм-ленинизм, философию, психологию, науковедение, библиотечное дело и информатику, физику и машиностроение и другие (всего 28 отраслей).

В настоящее время обмен информацией между АИС как в международном, так и в национальном плане осознан не только с практической, но также с экономической точек зрения. Несмотря на стремление к взаимному обмену информацией в АИС используются различные системы идентификации и кодирования информации. Наблюдаются и различные подходы к выделению и структурированию элементов информации как в документальных, так и фактографических ИПС. Поэтому взаимный обмен и использование баз данных на несовместимых форматах требует своего решения в частности дополнительных затрат на процедуру преобразования ее из одной системы кодирования в другую – ту, которая принята в эксплуатируемой АИС. Преобразование форматов из одной системы идентификации и кодирования в другую принято называть конвертированием. Конвертирование форматов в различных АИС может охватывать:
  • Носители информации – магнитные ленты, перфоносители, видеомагнитные и микрофильмовые записи.
  • Технологию формирования поискового образа документа и поискового предписания, обусловленную использованием различных типов ИПЯ.
  • Пакета прикладных программ.
  • Входного и выходного коммуникативного формата.

Уровень конвертирования может быть внутрисистемным, национальным, региональным, международным. Известно, что число форматов только в одной действующей АИС насчитывает более двух десятков. При этом замечена тенденция при разработке АИС использовать не только существующие форматы и информационную технологию, но и разрабатывать «новую» технологию, «свои» форматы. Развитие этой тенденции в дальнейшем может привести к разрыву связей, к снижению эффективности функционирования АИС. Решение этой проблемы связывает с одной стороны с разработкой многофункциональных форматов, а также высокой унификацией, как входного, так и выходного потока. Разработка и использование входных и выходных форматов в информационной технологии должно исходить из интересов создания единой государственной автоматизированной системы научно-технической информации, с учетом интересов многочисленных пользователей. Это в свою очередь потребует разработки не только многофункциональных форматов, но и открытых, что позволяет учитывать то новое и те изменения, которые проявляются у пользователей АИС. Информационная технология, ее форматы должны исключать дублирование, избыточность на всех уровнях подготовки и ввода документов в систему.


Отечественные отраслевые автоматизированные информационно-поисковые системы


Отраслевые автоматизированные информационные системы представляет собой основной вид АИС, призванных обеспечить удовлетворение информационных потребностей ученых и специалистов, нуждающихся в информации на основе банка данных системы. Необходимо отметить то положение, что, если основной функцией АИС Всесоюзных центров, как в настоящее время, так и в будущем является и будет являться подготовка и распределение баз данных на машиночитаемых носителях информации на основе глубокой аналитико-синтетической обработке мирового потока информации, то для отраслевых АИС доминирующим является представление потребителям информационных услуг по всем формам информационного обслуживания, которые объединяются формальным каналом доведения информации до потребителя. Непреложным условием организации надежной эксплуатации различных видов АИС является наличие в системе разветвленной сети совместимых локальных (местных) АИС, которые учитывают специфические (не общие) особенности обслуживания отдельных коллективов ученых и специалистов с определяющей ориентацией на удовлетворение индивидуальных потребностей ученых и специалистов.

Наличие локальных (тематических, проблемных, местных) АИС соответствует как принципу, так и структуре управления отраслями народного хозяйства в СССР. Уже у настоящему времени складывается довольно четкая структура автоматизированных информационных систем в отдельных отраслях народного хозяйства. Эти АИС включают кроме центральных АИС отрасли базовые (головные) АИС, которые представлены в отрасли народного хозяйства как автоматизированная система управления научно-производственным объединением, промышленным предприятием, научным учреждением, строительными и другими организациями.

Как между центральной отраслевой и головными (базовыми) АИС отрасли скоординированы действия по созданию баз данных, предмашинной обработке, подготовке рабочих листов, размножению магнитных лент, информационному обслуживанию в режимах «запрос-ответ», системе ИРИ и других формах услуг, так и скоординированы действия и полная совместимость функционирования головных (базовых) АИС с локальными (пром. предприятий, организаций).

В АИС отрасли функционирования систем обеспечивается за счет высокого уровня совместимости за счет применения отраслевых информационно-поисковых языков дескрипторного типа, за счет специализированных пакетов прикладных программ. Каждую автоматизированную информационную систему в отрасли надо рассматривать с той позиции, что она является частью государственной автоматизированной системы НТИ, которая в свою очередь входит в единую автоматизированную систему управления народным хозяйством.

Если характеризовать отраслевые АИС с точки зрения перечня форм информационных услуг, которые они могут представлять своим абонентам, то их можно отнести к классу интегральных информационных систем.

Как известно, для этого класса АИС характерной особенностью является то, что они относительно легко адаптируют базу данных, создаваемые Всесоюзными и другими центрами информации и сами в свою очередь реализуют одноразовый ввод документа в систему и многократное использование документов в различных формах информационных услуг.

Подготовка и ввод документов в отраслевые АИС обусловлены функционированием восходящего потока информации.

Учитывая специфику информационного обеспечения абонентов, а также все многообразие баз данных, которые поступают по нисходящему потоку, а также в результате обмена базами данных между отраслевыми АИС в отраслях народного хозяйства, эксплуатируют автоматизированные информационно-поисковые системы в настоящее время все шире и шире находит распространение опыт децентрализованной подготовки баз данных или предмашинных рабочих листов в условиях локальной, головной АИС отрасли с последующим представлением в центральную АИС для формирования баз данных в едином файле и последующем распределении информации на машиночитаемых носителях между всеми абонентами системы с учетом специфических особенностей функционирования базы данных в локальном АИС.

В принципе, все отраслевые АИС созданы по типовой схеме с учетом специфических особенностей сложившейся системы информационного обслуживания в отраслях народного хозяйства.

Так например, в отраслевой автоматизированной системе научно-технической информации «Реферат» Головным органом является ЦНИИЕЭИ приборостроения. На этот Центр возложены задачи создания информационного фонда (банка данных) по всей номенклатуре изделий, производящихся в отрасли, а также общим вопросам экономики приборостроения. На этот Головной информационный центр возлагается ответственность за хранение вторичных документов, поиск и распространение информации в виде информационных изданий, микрофиш, микрофильмов, а также выдачи полноразмерных копий документов, хранящихся непосредственно в Головном центре. Подготовка документов к вводу в отраслевую автоматизированную ИПС «Реферат» осуществляется децентрализовано, т.е. в тех головных (базовых) органах, за которыми закреплена определенная тематика формирования базы данных. В системе «Реферат» формами информационных услуг являются тематические подборки (библиографический список литературы по теме и копии малоформатных документов), ретроспективные библиографические указатели. Как видно из приведенного примера информационные услуги в системе «Реферат» являются услугами, которые представляют и представляли библиотеки. Поиск информации в системе «Реферат» осуществляется не только по элементам библиографического описания, но и числовым характеристикам, параметрам изделия.

В отраслевой системе «Реферат» первичные документы рассредоточены по головным, базовым (локальным) системам НТИ, которые в свою очередь входят в отраслевую систему и поэтому система «Реферат» кроме библиографического описания и реферата выдает сведения о месте хранения первичного документа.

Как известно, эффективность информационного поиска в любых ИПС, в том числе автоматизированных, оценивается критериями полноты и релевантности выданной информации. Эти критерии системы тесно увязываются с теми информационно-поисковыми языками, которые эксплуатируются в системе. В АИС «Реферат» используется ИПЯ дескрипторного типа с грамматикой. Индексирование документов осуществляется посредством непосредственного выделения ключевых слов из текста документа оператором с последующим их переводом в дескрипторы. В системе реализуется схема тождественного и нетождественного перевода ключевых слов в дескрипторы. Как и любая другая система, «Реферат» имеет подсистему подготовки и тиражирования магнитных лент с базами данных.

Программное обеспечение реализует любую как отдельно взятую стратегию поиска, так и их совокупность. Программное обеспечение позволяет изменять стратегию поиска в зависимости от предварительных результатов поиска.

Математическое обеспечение системы составляет пакет прикладных программ «ПЕГАС», которые разработан на базе операционной системы Единой серии ЭВМ и пакета прикладным программ «КАМА». Пакет прикладных программ «ПЕГАС» позволяет системе работать в режиме реального времени с удаленными терминалами.

Большинство отраслевых систем реализованы на ЭВМ Единой серии (ЕС). Система «Реферат» - на универсальном вычислительном комплексе М-4030, а также средствах микрофильмирования, копирования, тиражного размножения, средствах связи и другом оборудовании (см. рис. ).

Принцип создания, а также структура отраслевой автоматизированной системы Минлеспрома и Минбумпрома несколько отличны от системы «Реферат». Прежде всего эта система функционирует в рамках не одного, а двух министерств и включает три уровня органов НТИ:

а) отраслевой информационный центр, в состав которого входит ВНИПИЭИ Леспром, Главный вычислительный центр Минлеспром СССР и ЦНТБ Минбумпром;

б) органы НТИ НИИ и проектных организаций НИИ Минбумпром и Минлеспром;

в) органы НТИ предприятий и организаций этих министерств.

Между этими тремя уровнями органов НТИ четко определены задачи и скоординированы их функции.

Первый уровень системы осуществляет сбор, систематизацию и накопление как первичных, так и вторичных документов в соответствии с профилем указанных отраслей народного хозяйства. На него возложены функции по справочному и информационному обслуживанию потребителей в режимах «Ретро» и ИРИ.

Второй уровень системы обеспечивает сбор, систематизацию документов по соответствующей тематике, распределенной между органами НТИ второго уровня, а также подготовку информации в отраслевой вычислительный центр в форматах, установленных для системы. На этот уровень возложена ответственность за осуществление информационного обеспечения на базе отраслевого банка данных.

Информационное обслуживание предприятий и организаций осуществляют органы информации третьего уровня.

В отличие от системы «Реферат», где в комплексе лингвистического обеспечения используется ИПЯ дескрипторного типа в отраслевой системе Минлеспром и Минбумпром. Используется УДК, отраслевой Рубрикатор, построенный на базе Рубрикатора ГАСНТИ и отраслевой тезаурус. С грамматикой, в частности, используются указатели роли и связи.

Техническим заданием на проектирование системы предусмотрена разработка в отраслевой системе фактографической автоматизированной подсистемы. В качестве баз данных будут служить данные производственной и технико-экономической информации, а также сведения по свойствам материалов и веществ (см. рис. ).

Система реализована на вычислительном комплексе ЕС ЭВМ-1022, средствах оперативной полиграфии, микрофильмирования и копирования документов.

Для всех отраслевых автоматизированных ИПС характерны все те важнейшие функции, которые относятся к созданию эксплуатации баз данных и информационного обеспечения по закрепленным за ними отраслевым информационным массивам, включая вопросы сбора, систематизации, обработки, хранения документов в форматах, обеспечивающих формализованный автоматизированный поиск информации в отраслевых банках данных, а также подготовку и издание информационных материалов, включая обмен информационными массивами на машиночитаемых носителях информации.

Отраслевые АИС призваны по требованию абонентов обеспечить выдачу оригиналов или копий документов. Автоматизированные отраслевые системы на основе анализа функционирования подсистем должны обеспечить выдачу такой информации и в таком виде, в котором она необходима для принятия управленческих решений.

Примерная структура отраслевых АИС включает следующие подсистемы:

- сбора, обработки и ввода информации;

- хранения информации;

- информационного обслуживания;

- редакционно-издательских работ;

- передачи информации;

- управления отраслевой АСНТИ.

Для оценки эффективности функционирования автоматизированных информационных систем, в том числе и отраслевых практика выработала следующие показатели, характеризующие работу системы:

- количество коллективных и индивидуальных абонентов;

- количество разовых и постоянных запросов;

- число вводимых документов;

- количество выданных вторичных документов;

- а также полнота, точность выдачи, интервал выдачи, трудоемкость индексирования документов, и, наконец, стоимость обслуживания одного абонента в месяц, стоимость одного поиска.