Федеральное агентство по образованию и науке

Вид материалаРеферат
Подобный материал:
  1   2   3

Федеральное агентство по образованию и науке

ГОУ ВПО «Башкирский государственный педагогический университет им.Акмуллы.


Институт исторического и правового образования

Кафедра Всеобщей истории и культурного наследия


Реферат

По дисциплине: «Технические средства управления»

На тему: «Средства хранения и поиска документов»









Выполнила: студентка 5 курса заочного отделения

Специальности: «Документоведение и ДОУ»

_____________Д.Д. Латыпова

Проверила:

___________Л.А. Харсеева












Содержание


Введение

3

База данных документальной информационно-поисковых системы

5

Технические средства поиска и хранения информации

6

Поиск информации: основные понятия, виды и формы организации

11

Информационно поисковые системы

13

Организация поиска

19

Технология поиска информации

20

Реализация поиска

21

Оформление результатов

22

Критерии оценки поиска

22

Оценка и обработка результатов поиска

23

Интернет – поисковые системы

23

Заключение

30

Список литературы

31



Введение.

Хранение и поиск информации - процесс автоматизированного хранения и поиска информации, обеспечивающий ее выдачу для быстрой реализации. Все, что не так давно называли сведениями, фактами, данными, известиями, теперь называют одним общим словом «информация». Информация - это все: от простой записки до научной монографии. Информация - это все фиксированные сообщения: книги, газеты, журналы, фотографии, фильмы, магнитные записи, записи на пластинах, каталоги, реклама, отчеты, письма и т.д.
Хранение информации - процесс не менее древний, нежели жизнь человеческой цивилизации. В самые древние времена ее хранил и передавал из поколения в поколение человек-его интеллект, его опыт.
С рождением письменности родился новый механизм интеллектуального отбора. Возник специальный аппарат фиксирования и распространения мысли в пространстве и времени. Родилась документированная информация - рукописи и рукописные книги. Появились своеобразные информационно-накопительные центры - древние библиотеки и архивы. Они были важным атрибутом цивилизации. Постепенно письменный документ стал и орудием управления.
Вторым информационным скачком явилось книгопечатание. Типографский станок вызвал к жизни рост печатной продукции, небывало увеличил возможности накопления и размножения информации.

Каждую секунду в мире появляется около двадцати тысяч страниц текста о достижениях в различных отраслях науки и техники. Сто тысяч научных и технических журналов ежегодно. Они публикуют 2 миллиона статей и заметок по разным отраслям знания. К тому же ежегодно выходит более 10 тысяч научных книг. Специальных публикаций - бюллетеней, отчетов о конференциях и симпозиумах, рефератов - печатается до 2 миллионов экземпляров. Процесс этот пока неудержим. Количество таких изданий растет на 5-10 процентов в год. По образному выражению одного исследователя, если ученые во все времена только качались на информационных волнах в море научной информации, то сегодня они в ней просто задыхаются: информационный поток в наши дни в 15-20 раз выше реальных возможностей восприятия его человеческим мозгом.
Специалисты подсчитали, что в ближайшем будущем количество названий и тиражей печатной продукции будет катастрофически увеличиваться и накопление ее приведет к тому, что на каждого человека только в Европе, включая детей, придется для прочтения 7 тысяч страниц в месяц. В научных и научно-технических публикациях конденсирование информации необходимо. Наиболее распространенная форма такого приема - рефераты. Они собраны в реферативных журналах, которые издают, например, различные институты научной информации. Научные сведения сжимают здесь в рефераты, аннотации, библиографические описания, списки. Для реферативных журналов обрабатывают миллионы статей из книг,журналов, газет и других изданий.
Необходимы высокоэффективные средства обработки информации и новые технологии. Хранение и передача информации зависит от ее носителя. Машинная технология обработки информации основана на новых носителях, на которых записывают данные для хранения в памяти машин. В хранящиеся в памяти машины сведения называют базами данных, информационными массивами, а для их обработки используют информационно-поисковые системы. Наиболее характерный пример такой системы - автоматизированная система резервирования и продажи авиационных билетов. Для работы требуется информация о расписании движения самолетов, о ценах на билеты, о проданных и заказанных билетах. Система составляет базу данных, или информационный массив, этого автоматизированного «кассира контролера - администратора». При решении каждой очередной задачи - в разбираемом случае при оформлении заказа на билет - система нуждается во вводе только небольшой дополнительной информации: о содержании заказа. Остальная берется из базы данных. Изменение в ней - очень важное свойство хранение информации в памяти машины. Вновь вводимые сведения изменяют информационный массив, придают системе динамичность, способность к быстрой перестройке структуры данных, содержащихся в них сведений.


База данных документальной информационно-поисковой системы.

По характеру выдаваемой информации информационно поисковые системы делятся на документальные и фактографические. База данных документальной информационно-поисковой системы со стоит из множества элементов, которые описывают содержание документа. Причем под словом «документ» подразумевается и книга, и статья, и технический отчет, и патент и т. п. Информационный массив фактографической системы содержит элементы, каждый из которых относится к какому-то определенному объекту независимо от того, описан этот объект в одном документе или в нескольких. Например, системе неважно, сведения о меди содержатся в одном каком-то описании или разбросаны по многочисленным источникам. Для системы важно, чтобы она знала о меди все, что об этом химическом элементе известно на сегодня. Документальная и фактографическая информационные системы выдают пользователю информацию и по виду разную. Так, документальная, отвечая на посланный ей запрос, выдает сведения о множестве документов, где содержится нужная информация. Есть системы, которые указывают адрес хранения документов. Фактографическая же система тут же выдает на запрос необходимую пользователю информацию. Есть еще и комбинированные информационно-поисковые системы. Они совмещают в себе свойства документальной и фактографической систем. Информационные системы позволяют проводить анализ и оценку сведений, создавать и использовать банки данных, получать комплексно обработанную целевую информацию и оперативно обеспечивать ею пользователей.
Опыт показал, что хранение очень больших объемов информации оправдано только при условии, если поиск идет быстро, а сведения выдаются в доступной форме. Развитие информационных систем идет так быстро, что специалисты, разрабатывающие программы для них, вынуждены поспевать за техническими средствами. Автоматизированные информационно-поисковые системы произвели подлинный переворот в службе хранения, поиска и переработки информации. Они зарекомендовали себя как незаменимые помощники человека, превратив службу информации в подлинную индустрию информации, располагающую электронными архивами, электронными каталогами, электронными библиотеками и даже электронными информационными магазинами, в которых есть множество самых разнообразных данных: литературных, медицинских, экономических, научных, политических, из области образования и спорта.
Создали и «электронные энциклопедии» для разных специалистов информационно-поисковые системы для медиков, химиков, машиностроителей, экономистов.Подсчитано, что автоматизированное составление списка литературы из разного рода информативных материалов библиотеки сокращает затраты времени в 100-200 раз по сравнению с обычным. В одной из таких работ в информационную систему заложили библиографию, включающую 275 тысяч названий книг. Каждую неделю память системы пополнялась 300 новыми названиями. Система выдавала более трех миллионов справок о различных произведениях, их авторах, содержании, количестве страниц, годе издания,- любой ответ можно получить через секунду.
Ныне прогресс микроминиатюрной электроники резко увеличил емкость хранилищ информации, а успехи лазерной техники позволили увеличить пропускную способность каналов передачи информации. Только один компактный диск диаметром до двенадцати сантиметров вмещает миллион страниц текста - громадный архив документов, статей, фотографий, чертежей, всевозможных бумаг. В цифровой форме на диске могут быть записаны самые разные географические и топографические карты, схемы, цветные рисунки. Все 9 миллионов слов «Американской энциклопедии» заняли лишь одну пятую часть компактного диска.
Развитая сеть институтов и центров хранения и поиска информации непрерывно ведет пере работку дорогостоящего «информационного продукта». Чем измеряются результаты такой работы? Не только количеством и качеством информации, но также и умением сжимать информацию об информации, помогая потребителю лучше в ней ориентироваться, а в конечном итоге способствовать накоплению все большего и большего интеллектуального богатства.

Технические средства поиска и хранения информации

Методы и средства поиска информации являются специальной отраслью знаний. Они приобретает большое значение как в области научных исследований и опытно-конструкторских разработок, так и в процессе производства промышленной и сельскохозяйственной продукции. Поиск информации требует специализированных средств. Система поиска входит как составная часть в общую систему научно-технической информации. Последняя включает средства копирования, хранения, размножения, поиска, приема и передачи информации. Технические средства и процесс поиска информации во многом зависят от вида носителя информации. Долгое время основным носителем информации являлась бумага. Это имело существенные недостатки – малая плотность информации, низкая степень автоматизации различных процессов и, как следствие, – большие затрат ручного труда. Применение микроформ на пленочных основах как носителей информации позволило в значительной мере уменьшить эти недостатки. Роликовые микроформы (микрофильмы) обеспечили компактное хранение больших объемов информации. Плоские микроформы в виде микрофишей более удобны при использовании сравнительно небольшого количества информации. Емкость современной микрофиши 96 машинописных страниц, около 2 Мбит. Ультрафиши обладают увеличенной более чем в 2 раза емкостью. Состояние современной телекоммуникационной инфраструктуры позволяет библиотекам создать и поддерживать свой собственный библиотечно-информационный сервер Интернет. Библиотечно-информационный сервер должен включать в себя как системы он-лайнового, так и офф-лайнового доступа. При создании библиотечно-информационного сервера следует, прежде всего, четко выработать концепцию сервера – какую информацию и как представлять.

На библиотечно-информационном сервере следует представлять следующую информацию:
  • общее описание библиотеки и ее фондов.
  • режим работы подразделений,
  • контактную информацию,
  • сведения о текущих будущих событиях,
  • доступ к каталогам.

Технология WWW серверов делает возможным представление текстовых документов и графической информации. Следует выделить, по крайней мере, пять информационных форматов, которые позволяют получить оперативный доступ к электронным документам. Им соответствуют пять уровней информативности.

Первый уровень – библиографический формат, информационный формат, краткое описание, формат UNIMARC. Сохраняются в текстовом формате.

Второй уровень представлен реферативными статьями. Они могут обеспечивать первичный отбор информации и помогают избежать рассмотрения материалов, которые содержат только краткие упоминания о предмете исследований. Сохраняются в текстовом формате.

Третий уровень – полные документы в текстовом формате. Этот формат обеспечивает наилучшее соотношение информативность/объем и обеспечивает хорошую скорость передачи данных. Сохраняются в текстовом формате.

Четвертый уровень – растровые изображения страницы, которые обеспечивают точные копии оригинала. Их можно наблюдать на экране, распечатать или переслать по факсу. Сохраняются в графическом формате.

Пятый уровень – формат PDF (portable document format) фирмы Adobe, который обеспечивает компактность и масштабирование текста и графики. Сохраняется в векторном формате.Отдельно следует рассматривать HTML язык.

Все форматы должны быть доступны через одну информационную систему и предоставить пользователю возможность выбора. Гибкость таких систем определяется стоимостью доступа и временем обработки информации. Выбор средств доступа должен стать посильной задачей для пользователя.

При наличии больших объемов документов вопрос о рациональном способе их хранения становится весьма актуальным. Основными требованиями к системе хранения документов являются:

удобство и простота организации, пополнения и замены документов;

удобство и простота поиска документов;

минимальный размер занимаемой площади;

невысокая стоимость.



Рис. 1. Классификация средств хранения документов

Средства хранения документов - это прежде всего папки, альбомы, конверты, футляры, которые размещаются в картотеках, на полках, стеллажах, в шкафах, сейфах.

Наибольший интерес представляют картотеки.

Картотека – это устройство, содержащее большое количество карт (документов стандартной формы, папок и т. п.), объединенных общностью содержания и расположенных в систематизированном порядке.

Разработано и применяется большое число конструкций различных картотек: плоских, вертикальных, вращающихся и др. Карты в картотеках располагаются по порядковым номерам, алфавиту, по темам, а иногда и произвольно. Для облегчения поиска карт в массиве применяются разделители (индикаторы) с четко видимыми классификационными признаками подмассивов. Плоские картотеки – карточки располагаются таким образом, чтобы один из краев последующей карты выступал из-под всех предыдущих и можно было бы видеть идентификатор каждой карты.

Плоские картотеки часто называют также ступенчатыми, обозримыми. Вертикальные картотеки представляют собой ящики (лотки) с вертикально расположенными в них картами. Карты могут размещаться свободно или закрепляться горизонтальным стержнем, проходящим через пробитые в картах отверстия. Вертикальные картотеки получили чрезвычайно широкое распространение. Их используют для работы с картами учета документов в бухгалтериях, отделах кадров и других отделах предприятий, в архивах, библиотеках и др. Достоинство вертикальных картотек: простота, дешевизна, большая вместимость; недостаток – относительная трудность поиска карт. Для хранения документов на рабочих местах в ящиках рабочих столов получили широкое применение подвесные вертикальные картотеки. Для этих картотек используют специальные папки подвесного хранения, в которые закладываются карты или документы, содержащие необходимую информацию. Вращающиеся картотеки – это барабаны, вращающиеся вокруг вертикальной (реже горизонтальной) оси, в секциях которых расположены карты или папки с помещенными в них документами. Другой разновидностью вращающихся картотек является устройство, на стержне которого жестко закреплены информационные карты. Подобного типа картотеки обычно используются для организации справочных установок массового пользования, например, в каталогах библиотек. Вращающиеся картотеки обоих видов часто оборудуются механизмами автоматизированного поиска.

Элеваторные картотеки представляют собой устройство, в котором организована автоматизированная подача подвешенных к роликовой цепи лотков (ящиков) с картами или иными документами на рабочее место оператора. Подача лотков осуществляется в соответствии с адресом (кодом, идентификатором) рабочего места, набираемым на пульте управления. Картотеки с перфокартами на картах с краевой перфорацией позволяют осуществлять легкий механизированный поиск. Карта с краевой перфорацией представляет собой прямоугольник из плотной бумаги, вдоль всех краев которого нанесены ряды калиброванных отверстий: с одним или несколькими (чаще двумя) отверстиями в каждой позиции. При занесении поискового кода на карте производится вырезка перемычки, отделяющей соответствующее отверстие от края перфокарты, так, что образуется открытая щель. На центральное информационное поле перфокарты, свободное от отверстий, заносится вся необходимая информация печатным способом, копированием документа или вручную. Поиск карт с нужной информацией осуществляется протыканием стержнем через отверстие, соответствующее поисковому коду, выровненной колоды карт и встряхиванием этой колоды. При встряхивании нужные перфокарты из колоды выпадают. С помощью подобной процедуры можно из массива, содержащего 6-7 тыс. карт, легко отобрать все интересующие карты по 5 - 6 признакам. Картотеки микрофильмов, содержащие занесенные в информационное поле перфокарты микрофотокопий документов, позволяют легко создавать удобные информационно-поисковые системы в весьма рапространенных и эффективных системах хранения микрофильмированной документации. Микрофотокопия документа представляет собой уменьшенную во много раз копию документа на рулонной (микрофильм) или плоской (микрокарта) фотопленке. Основное назначение микрофильмирования: создать емкие хранилища документов с сокращением необходимой для хранения площади в десятки раз; облегчить процедуры поиска документов; обеспечить простой и оперативный процесс копирования и размножения документов. Из всех используемых на практике систем хранения документов системы хранения информации на микрофильмах имеют наибольшую емкость и наименьшую стоимость хранения единицы информации. Известны информационно-поисковые системы на микрофильмах емкостью несколько десятков миллионов документов со средним временем поиска нужного документа и получения с него фотокопии 10-20 мин. Выпускается большая гамма всевозможных устройств микрофотокопирования, репродуцирования, копирования, визуального просмотра, автоматизированного поиска и хранения микрофотокопий.

Поиск информации: основные понятия, виды и формы организации

Поиск информации или информационный поиск представляет один из основных информационных процессов. Человечество издревле занималось им. Цели, возможности и характер поиска всегда зависели от наличия, информации, её важности и доступности, а также средств организации поиска. Конец XX - начало XXI века, характеризуется огромными массивами постоянно растущей разнообразной информации, доступной и представляющей интерес для самых широких слоев социума. Более того, Интернет-технологии и программно-технические средства, также доступные большинству людей, позволяют осуществлять данный процесс в любое время, практически в любом месте по любым запросам. Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению лицом, осуществляющим поиск, нужных ему сведений, знаний и т.д. для повышения собственного профессионального, культурного и любого иного уровня; создания новой информации и формирования новых знаний; принятия управленческих решений и т.п.

Интернете работает 30 и более миллионов пользователей. Из них десятки тысяч - в режиме онлайн (англ. "on-line" - интерактивный доступ в любой момент времени) и количество таких пользователей постоянно растет. Это затрудняет организацию оперативного поиска и нахождения нужной такому количеству пользователей информации. Возникают проблемы, обусловленные разнообразными возможностями (видами) поиска информации, различными способами их реализации в информационно-поисковых системах (ИПС), разным уровнем знаний пользователей о возможностях таких систем, особенно в области формирования запросов и обработки данных, полученных в результате выполнения этих запросов и т.д.

Предполагается, что в дальнейшем будут созданы ИПС, способные автоматически адаптироваться с учетом уровня знаний и запросов конкретных пользователей, воспринимать запросы на естественном языке и, используя искусственный интеллект, выдавать им релевантную и пертинентную информацию. Для создания таких ИПС потребуются интеллект и знания конкретных пользователей ИПС или их посредников. Пока же от широкого круга пользователей поисковых систем требуется достаточно хорошо владеть данной предметной областью. Существуют различные толкования термина "поиск информации" или "информационный поиск". Термин "информационный поиск" (англ. "information retrieval") ввёл американский математик К. Муэрс. Он заметил, что побудительной причиной такого поиска является информационная потребность, выраженная в форме информационного запроса. К объектам информационного поиска К. Муэрс отнес документы, сведения об их наличии и (или) местонахождении, фактографическую информацию. Решать проблемы фактографического поиска первыми стали представители библиотек. Они разработали средства информационного поиска, получившие название "справочно-поисковый аппарат" (каталоги, библиографические указатели и др.). В профессиональной отечественной печати данный термин используется с 1970-х годов. Библиотекари определяют "информационный поиск" как нахождение в информационном массиве документов, соответствующих информационному запросу пользователей. С точки зрения использования компьютерной техники "информационный поиск" - совокупность логических и технических операций, имеющих конечной целью нахождение документов, сведений о них, фактов, данных, релевантных запросу потребителя. "Релевантность" - устанавливаемое при информационном поиске соответствие содержания документа информационному запросу или поискового образа документа поисковому предписанию. Существуют и другие определения. В любом случае, информационный поиск вызван потребностью удовлетворения информационных запросов пользователей, ожидающих с помощью поисковых систем оперативно получить необходимые им данные или сведения. Он является методом нацеленного поиска и извлечения релевантных документов и (или) фактов из различных источников информации, например, банков данных или запоминающих устройств. В качестве таковых выступают живые и неживые объекты, представляющие различные источники и носители информации. Системы, обеспечивающие реализацию подобного поиска информации, называются поисковыми системами (ПС). В традиционных технологиях ПС представляют картотеки и каталоги, адресные и иные справочники, указатели, энциклопедии, справочный аппарат к изданиям и другие материалы. В 1945 годы американский ученый и инженер В. Буш в статье "Возможный механизм нашего мышления" впервые широко поставил вопрос о необходимости механизации информационного поиска. Начиная с 1960 годов, появляются автоматизированные поисковые системы, работающие с информацией. С этого периода ведутся интенсивные работы в области формирования и реализации принципов и методов информационного поиска. "Поисковые системы" осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова. Электронные ПС с помощью обычных или интеллектуальных терминалов (ПЭВМ) дают возможность пользователям производить поисковые запросы при помощи формальных и описывающих содержание элементов и с применением специальных логических операторов; осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова. Поисковые системы позволяют осуществлять только поисковые процедуры и связанные с ними процессы.