Отчет о нир листов

Вид материалаОтчет

Содержание


DCMI Metadata Terms
Dublin Core Metadata Element Set
Guidelines for implementing Dublin Core in XML
Схемы XML для поддержки рекомендаций по реализации DC в XML
Подобный материал:
1   ...   8   9   10   11   12   13   14   15   ...   47

.6Локальный профиль «Форматы метаданных при информационном обмене между программными системами ЭГ»

.6.1Область применения


Поскольку понятие «метаданные» («данные о данных») является весьма широким и допускает различные трактовки, для целей настоящего профиля принимается суженное толкование термина:
  • под метаданными понимаются статические сведения, непосредственно описывающие информационные объекты взаимодействия – т.е. те электронные документы, которыми системы обмениваются или с которыми совершаются какие-то действия (нотаризация и т.п.). Метаданные вытекают из конкретного содержания и свойств того или иного объекта, а не параметров окружения и процедуры взаимодействия. В частности, из понятия «метаданные» исключаются различные средства автоматизации его жизненного цикла (например, схемы обработки, описания связанных ЭАР).
  • метаданные в должны быть a) структурированными; б) целостными в рамках одного метаописания; в) формируемыми, валидируемыми и интерпретируемыми по единым для всех метаописаний данного типа формальным правилам.
  • метаданные должны обладать свойством отчуждаемости от исходного документа («принцип библиографической карточки»), т.е. формат их представления должен обеспечивать а) простое извлечение метаданных из документа, если они хранятся внутри него; б) возможность интерпретации метаданных без обращения к содержимому документа; в) возможность интерпретации документа без обращения к его метаданным.
  • метаданные должны обладать свойством автономности, т.е. их корректная интерпретация должна быть возможна без обращения к внешним ресурсам, по фиксированным правилам и с использованием ограниченного набора стандартизованных контролируемых справочников.
  • метаданные должны быть однозначно связаны с описываемым ими экземпляром документа. При этом, с учетом текущих ограничений инфраструктуры, документ может как находиться в сетевой среде и, соответственно, адресоваться с помощью стандартного механизма URI, так и размещаться на сменном машинном носителе. Для документов (информационных объектов), идентичных по содержанию, но различных по формату и способу представления (в т.ч. для переводов) должны использоваться различные метаописания. Обратная связь не регламентируется, документ может иметь произвольное количество метаописаний и не обязан содержать сведений о них.

.6.2Состав метаданных


С учетом вышеизложенных принципов метаданные могут содержать следующие сведения о документе:
  • дескриптивные данные – данные, непосредственно описывающие содержимое документа и его неотъемлемые реквизиты (заголовки, аннотации, сведения об авторах и иных участниках и т.п.)
  • технологические данные – сведения о языке, форматах и кодировках, а также сведения о местонахождении оригинального экземпляра описываемого документа
  • статические параметры жизненного цикла – сведения о юридически значимых статусах, резолюциях, датах принятия, раскрытия, периодах действия и т.п., непосредственно отражаемых в содержимом документа или его реквизитах.

.6.3Назначение метаданных


В отличие от собственно данных (например, электронных документов), которые могут быть представлены в различной, как правило, неструктурированной форме, метаданные по определению являются строго структурированными. Метаданные отделяемы от описываемых ими данных, однако всегда содержат связь с исходными данными (например, адрес документа). Эти свойства определяют назначение и способы применения данных:

.6.3.1Поиск


В настоящее время как в глобальных информационных сетях, так и в корпоративных информационных системах, работающих с неструктурированной текстовой информацией (документами), преобладает т.н. контекстный или «полнотекстовый» подход к поиску. Однако он имеет существенные недостатки:
  • проблемы с релевантностью. В большинстве случаев запрос содержит много поискового «мусора», не имеющего отношения к искомым документам.
  • поиск по контексту не может обеспечить полноты, точности и связности выдаваемых результатов. Нельзя гарантировать, что в результаты будут включены все существующие документы по какому-то формальному критерию, трудно сортировать и группировать результаты по формальным критериям.
  • сложный поиск, отчасти снижающий проблемы 1 и 2, требует высокой квалификации пользователя.

Для государственных систем это резко снижает применимость контекстного поиска. Кроме того, указанные проблемы резко возрастают при попытке использовать контекстный метод к нетекстовым объектам – например, рисункам, чертежам и т.п.

Использование поиска по метаданным позволяет преодолеть все эти проблемы, хотя усложняет процесс подготовки электронного документа, включая в него специальную стадию метаописания, в ходе которой квалифицированный пользователь должен структурно описать содержание, атрибуты и реквизиты каждого вновь созданного или отредактированного объекта. Взамен появляется возможность вести поиск по формальным признакам (например, по конкретному реквизиту документа), что невозможно при полнотекстовой индексации. Кроме того, поиск по метаданным производительнее и менее ресурсоемок.

.6.3.2Каталогизация


Из задач поиска прямо вытекает задача каталогизации – т.е. построения упорядоченных и удовлетворяющих требованию полноты по какому-либо критерию индексов. Такие индексы могут вестись не только создателями документов и системами, где они хранятся, но и внешними агентами, что позволяет организовать распределенный поиск (человек или система работают с централизованным каталогом, а, найдя нужный документ, связываются с нужным хранилищем).

Наличие структурированных описаний позволяет значительно автоматизировать эту операцию, так, например, удаленные системы могут формировать специфические тематические каталоги документов, публикуемых информационной системой центрального органа.

.6.3.3Информационный обмен


«Отчуждаемость» метаданных позволяет во многих случаях исключить из трафика систем собственно информационные объекты. Системы могут обмениваться метаданными, а при необходимости получения самого документа – запросить его из удаленного хранилища.

.6.3.4Обработка


Метаданные могут содержать не только описательные, относительно неизменные поля, но и динамически изменяющиеся сведения, связанные с жизненным циклом документа (например, отметки о просмотрах, согласования, резолюции, архивные метки). Таким образом, многие задачи документооборота могут быть сведены обменом «библиографическими карточками», на которых и ставятся необходимые отметки. При этом документ остается неизменным, что упрощает процедуру его электронной нотаризации и удостоверения.

.6.4Перечень применяемых спецификаций


Применяемые спецификации для представления метаданных определяются базовой спецификацией метаданных дублинского ядра:

DCMI Metadata Terms

Термины метаданных DCMI

e.org/documents/dcmi-terms/

Документ представляет собой текущую спецификацию всех терминов метаданных, поддерживаемых Dublin Core Metadata Initiative. Спецификация включает элементы, квалификаторы, схемы, справочники.

Dublin Core Metadata Element Set

Набор элементов метаданных Дублинского Ядра.

e.org/documents/dces/

Документ представляет собой справочное описание набора элементов метаданных Дублинского Ядра версии 1.1.

Guidelines for implementing Dublin Core in XML

Руководящие указания (рекомендации) для реализации Дублинского ядра в XML.

e.org/documents/2003/04/02/dc-xml-guidelines/

Документ предоставляет руководящие указания (рекомендации) для разработчиков XML-приложений, использующих метаданные Дублинского Ядра – как простого, так и с квалификаторами.

Схемы XML для поддержки рекомендаций по реализации DC в XML

e.org/schemas/xmls/

Dublin Core:    e.org/schemas/xmls/qdc/2006/01/06/dc.xsd

DCMI Terms:  e.org/schemas/xmls/qdc/2006/01/06/dcterms.xsd

DCMI Types:  e.org/schemas/xmls/qdc/2006/01/06/dcmitype.xsd

Simple DC:      e.org/schemas/xmls/qdc/2006/01/06/simpledc.xsd

Qualified DC:   e.org/schemas/xmls/qdc/2006/01/06/qualifieddc.xsd