Информационные технологии управления

Вид материалаДокументы

Содержание


Технологии World Wide Web
3.3.1. Гипертекст и языки разметки гипертекста
Ванневар Буш
Архитектура гипертекстовой системы
Языки разметки документов
Язык разметки документов
Язык гипертекстовой разметки SGML
Глава 1. 1.1. Основные понятия
Подобный материал:
1   ...   9   10   11   12   13   14   15   16   ...   36

3.3. WEB-технологии



В современных условиях работа с документами требует наличия технологий, обеспечивающих связывание тематически близких документов, передачу документов по компьютерным сетям без искажений с удовлетворительной скоростью с возможностью быстрого просмотра, редактирования документа, отфильтровывания ненужных документов и т.д. К таким технологиям в настоящее время относят технологии World Wide Web (Web-технологии) и технологии ODA (см. разд. 3.5.). Их иногда объединяют термином «технологии тиражирования информационных ресурсов».

World Wide Web - WWW - Web – всемирная компьютерная информационная система, основанная на гипертексте. О создании WWW было объявлено в 1989 г. лабораторией физики элементарных частиц европейского центра ядерных исследований (CERN). WWW была разработана для обмена информацией разного вида: текстовой, графической, видео-, звуковой. С 1989 г. можно вести отсчет стремительному распространением web-технологии.

WWW работает по принципу клиент-сервер, точнее, клиент-серверы: существует множество серверов, которые по запросу клиента возвращают ему гипермедийный документ — документ, состоящий из частей с разнообразным представлением информации (текст, звук, графика, трехмерные объекты и т.д.), в котором каждый элемент может являться ссылкой на другой документ или его часть. Гипертекст позволяет как угодно глубоко переходить по названиям-ссылкам, составляя все более полное представление о проблеме.

Ссылки в документах WWW организованы таким образом, что каждый информационный ресурс в глобальной сети Internet одно­значно адресуется, и документ, который прочитывается в данный момент, способен ссылаться как на другие документы на этом же сервере, так и на документы (и вообще на ресурсы Internet) на других компьютерах Internet. Причем пользователь не замечает этого и работает со всем информационным пространством Internet как с единым целым. Ссылки WWW указывают не только на документы, специфичные для самой WWW, но и на прочие сервисы и информационные ресурсы Internet. Более того, большинство программ-клиентов www (browsers, навигаторы) не просто понимают такие ссылки, но и являются программами-клиентами соответствующих сервисов: FTP, Gopher, сетевых новостей Usenet, электронной почты и т.д. (см. разд. 3.4.) Таким образом, программные средства WWW являются универсальными для различных сервисов Internet, а сама информационная система www играет интегрирующую роль.

Технологии WWW обеспечивают связь ресурсов Internet, в единую систему, предусматривающую возможность навигации и поиска.

Технологии World Wide Web (Web, WWW) - технологии организации информационных ресурсов Internet, предусматривающая размещение информации на компьютерах-серверах в специальном формате, обеспечивающем легкий переход от одной порции информации к другой.

Основными компонентами Web - технологии являются:
  • язык разметки гипертекста HTML;
  • протокол передачи гипертекстовых данных http;
  • система адресации информационных ресурсов URL;
  • универсальный интерфейс шлюзов CGI.

3.3.1. Гипертекст и языки разметки гипертекста


Рост количества полнотекстовых документов, представленных в электронном виде, требует развития соответствующих методов навигации в информационных фондах. На сегодняшний день традиционной формой представления текстовой информации в электронном виде следует считать гипертекст, основные достоинства которого — интерактивность работы с материалом и многомерность представления. Конкретные реализации гипертекста варьируются как по способу установления связей, так и по форме визуального отображения — от простейших форм, представленных справочными системами и web-страницами, где возможные переходы по тексту жестко задаются разработчиком, до «интеллектуальных» электронных энциклопедий и учебников, в которых каждое слово раскрывается сетью гиперссылок, представленных связанными по смыслу понятиями. Гипертекст (или нелинейный текст), совмещающий положительные свойства энциклопедии, монографии и тезауруса, обладает рядом характеристик, свойственных как тексту, так и фонду, и не может быть отождествлен ни с одним из существующих методов систематизации информации.

Гипертекст - система электронных документов, снабженная перекрестными ссылками как внутри документов, так и между различными документами.

Технологии гипертекста начали разрабатываться в 1945 г., а первые работающие гипертекстовые системы создали в 1967 г. Энди Ван Дам и в 1968г. Дуглас Энгельбарт. Иногда их называют  отцами гипертекста.  Однако первые признаки гипертекста можно найти еще в работах В. Буша. Термин «гипертекст» введен В. Бушем еще в 1965 году и конкретизирован Тедом Нельсоном.

Ванневар Буш

В 1945 г. в проекте машины Memex предложил механизм перекрестных ссылок, аналогичный используемому в современном гипертексте. Ссылки предлагалось реализовать с помощью вспомогательных полей в теле документов. Этот механизм  направлен на  создание из отдельных документов виртуальных книг в соответствии с  потребностями пользователей.  

Обычному (одномерному) тексту, который можно интерпретировать как длинную строку символов, читаемую в одном направ­лении, последовательно строка за строкой, страница за страницей, противопоставлен многомерный текст. В отдельных точках такого ветвящегося многомерного текста чтение можно продолжать в нескольких различных направлениях в зависимости от информационной потребности. Гипертекст может отличаться от обычного текста порядком следования материала, элементы гипертекста могут размешаться в виде иерархического дерева или сетевой организации, он может иметь несколько уровней краткого изложения и детализации материала, способов его представления и т.д. Таким образом, тексты, составленные на естественном языке, хранятся, будучи организованными по новому принципу. Пользователь будет просматривать текст и в процессе чтения осуществлять отбор нужных данных.

Информационные системы, созданные по технологии гипертекста, предназначены для систематизации текстовой информации и по глубине формализации информации занимают положение между документальными и фактографическими системами:
  • в документальных системах находится информация, которая указывает на источники, содержащие интересующие пользователя сведения, в гипертексте кроме ссылок содержится и конкретная семантическая информация.
  • в фактографических массивах хранятся главным образом значения тех или иных показателей раз­личных объектов, в гипертексте — текстовые данные, в различных аспектах конкретно характеризующие объект. Поиск в гипертексте - семантически более сложная задача, чем выдача сведений на четкие конкретные фактографические запросы.
  • при использовании документальных и фактографических систем требуемые пользователям фрагменты текста не всегда легко идентифицировать, поскольку поисковые образы фрагментов и запросы к ним в значительной степени огрублены применяемыми информационными языками, в гипертексте эта проблема снимается.

Компонентами гипертекста являются: заголовок, текст и список ссылок на родственные статьи, объединяемые термином «информационная статья».

Статьи должны быть легко обозримыми, чтобы понять, стоит ли их пристально читать или надо перейти к изучению других, близких по смыслу статей. Возможно несколько вариантов оформления списка ссылок на родственные статьи: столбцом – непосредственно после заголовка статьи или по тексту статьи, как в энциклопедиях, где упоминания о родственных объектах даются либо в виде графических выделений, например, курсивом, либо в явном виде в скобках (см. «...»). Возможен смешанный способ оформления списка ссылок: часть ссылок размещается после заголовка статьи, а часть в ее тексте. Типы связей между статьями указываются с помощью специальных символов. Для удобства создается список главных тем, в который включаются заголовки всех справочных статей, не имеющих ссылки с отношениями «вид – род» и «часть – целое». Список главных тем должен составлять 5-7 легко запоминаемых пунктов.

В гипертексте желательно иметь оглавление, которое несет традиционную нагрузку. Оглавление представляет собой алфавитно-упорядоченный перечень названий всех имеющихся в гипертексте статей.

Архитектура гипертекстовой системы


Архитектура гипертекстовой системы включает:
  • гипертекстовую базу данных (гипербаза данных, гипертекст);
  • систему управления гипертекстом.

Система управления гипертекстом включает два инструментальных комплекса. Один используется в качестве инструмента интерактивного управления процессами броузинга, а второй — в процессах создания и ведения гипертекста.

Навигация – управление процессом перемещения в гиперпространстве из произвольного узла отправления в узел прибытия.

Навигация – центральное понятие концепции гипертекста. Специфической составляющей навигации является броузинг.

Броузинг – процесс просматривания гипертекстовых документов или гипертекстовой базы данных с целью изучения информации, но не ее изменения.

Броузинг осуществляется в процессе навигации по предустановленным связям. Замечено, что броузинг стимулирует творческое мышление и что в процессе броузинга может возникать эффект «творческого озарения» (для его обозначения в англоязычной литературе используется понятие serendipity), он может быть настолько сильным, что заставит радикально изменить цель броузинга. Богатство установленной системы связей зависит от знаний, которыми обладает автор (разработчик) гипертекста, и от его способности создать гипертекст, ориентированный на различные категории пользователей и на различные задачи, ради которых создается гипертекстовая информационная среда.

Языки разметки документов


Идея использования стандартных форматов для подготовки структурированных мобильных документов, которые могут быть перенесены с одной компьютерной платформы на другую, зародилась в 60-е годы. Пионерами в этой области были организация Graphic Communications Association (GCA), разработавшая систему GenCode для обмена документами между различными предприятиями, и корпорация IBM, разработавшая язык обобщенной разметки GML для обмена документами внутри корпорации. В результате совместных усилий был разработан язык SGML (Structured Generalized Markup Language), принятый в качестве стандарта ISO в 1986 г.

Язык разметки документов - это набор специальных инструкций, называемых тэгами, предназначенных для формирования в документах какой-либо структуры и определения отношений между различными элементами этой структуры.
Язык гипертекстовой разметки SGML

Основная идея языка SGML состоит в том, что текст документов дополняется информацией (метаданными), задающей макетную и логическую структуры документа. Выделение элементов логической и макетной структур документа осуществляется с использованием меток, часто называемых тэгами или управляющими дескрипторами, которые отмечают начало и конец выделяемого фрагмента. Тэги языка в таких документах кодируются, выделяются относительно основного содержимого документа и служат в качестве инструкций для программы, производящей показ содержимого документа на стороне клиента. В самых первых системах для обозначения этих команд использовались символы “<” и “>”, внутри которых помещались названия инструкций и их параметры. Сейчас такой способ обозначения тэгов является стандартным. Модель документа SGML называют таговой. Выделение элемента может не сопровождаться указанием способа его форматирования. Такая разметка документа называется описательной или дескриптивной. Описательная разметка обеспечивает мобильность документа, так как не содержит требований к представлению его фрагментов. Документ, содержащий описательную разметку, может быть перенесен на другую платформу, в среду другой системы поддержки текстовых документов, в которой может быть по­лучено надлежащее представление документа.

Развитие идей описательной разметки привело к определению разметки как формального языка описания документов. При выполнении разметки пользователь выделяет каждый значимый элемент документа, помечая его с помощью идентификатора, характеризующего этот элемент. В частности, приведенный ниже пример фрагмента текста с разметкой SGML может выглядеть следующим образом:

Пример текста

Размеченный текст

Глава 1.

1.1. Основные понятия

При выполнении разметки пользователь выделяет каждый значимый элемент документа.




Глава 1.





1.1. Основные понятия



<р>

При выполнении разметки пользователь выделяет каждый значимый элемент документа.