Отчет о нир листов
Вид материала | Отчет |
СодержаниеDCMI Metadata Terms Dublin Core Metadata Element Set Guidelines for implementing Dublin Core in XML Схемы XML для поддержки рекомендаций по реализации DC в XML |
- Отчет нии экспериментальной медицины сзо рамн о выполнении плана нир за 2009г и план, 29.72kb.
- Отчет о научно-исследовательской работе за 2007 год Тема нир: Разработка и создание, 107.74kb.
- Отчет о научно-исследовательской работе за 2007 год Тема нир: Разработка новых радиоволновых, 53.72kb.
- Отчет о научно-исследовательской работе за 2008 год Тема нир: Разработка новых радиоволновых, 49.86kb.
- Отчет о научно-исследовательской работе за 2008 год Тема нир: Исследование новых механизмов, 65.37kb.
- Лексикология для высших учебных заведений1[1], 2831.98kb.
- Отчет о научной деятельности Сибирского государственного индустриального университета, 292.94kb.
- Р. И. об итогах нир университета за 2009 год на Ученом совете от 8 февраля 2010 год, 887.59kb.
- Отчет о нир/окр (бумажная версия) (наименование отчета), 45.75kb.
- Отчет по нир, 650.93kb.
.6Локальный профиль «Форматы метаданных при информационном обмене между программными системами ЭГ»
.6.1Область применения
Поскольку понятие «метаданные» («данные о данных») является весьма широким и допускает различные трактовки, для целей настоящего профиля принимается суженное толкование термина:
- под метаданными понимаются статические сведения, непосредственно описывающие информационные объекты взаимодействия – т.е. те электронные документы, которыми системы обмениваются или с которыми совершаются какие-то действия (нотаризация и т.п.). Метаданные вытекают из конкретного содержания и свойств того или иного объекта, а не параметров окружения и процедуры взаимодействия. В частности, из понятия «метаданные» исключаются различные средства автоматизации его жизненного цикла (например, схемы обработки, описания связанных ЭАР).
- метаданные в должны быть a) структурированными; б) целостными в рамках одного метаописания; в) формируемыми, валидируемыми и интерпретируемыми по единым для всех метаописаний данного типа формальным правилам.
- метаданные должны обладать свойством отчуждаемости от исходного документа («принцип библиографической карточки»), т.е. формат их представления должен обеспечивать а) простое извлечение метаданных из документа, если они хранятся внутри него; б) возможность интерпретации метаданных без обращения к содержимому документа; в) возможность интерпретации документа без обращения к его метаданным.
- метаданные должны обладать свойством автономности, т.е. их корректная интерпретация должна быть возможна без обращения к внешним ресурсам, по фиксированным правилам и с использованием ограниченного набора стандартизованных контролируемых справочников.
- метаданные должны быть однозначно связаны с описываемым ими экземпляром документа. При этом, с учетом текущих ограничений инфраструктуры, документ может как находиться в сетевой среде и, соответственно, адресоваться с помощью стандартного механизма URI, так и размещаться на сменном машинном носителе. Для документов (информационных объектов), идентичных по содержанию, но различных по формату и способу представления (в т.ч. для переводов) должны использоваться различные метаописания. Обратная связь не регламентируется, документ может иметь произвольное количество метаописаний и не обязан содержать сведений о них.
.6.2Состав метаданных
С учетом вышеизложенных принципов метаданные могут содержать следующие сведения о документе:
- дескриптивные данные – данные, непосредственно описывающие содержимое документа и его неотъемлемые реквизиты (заголовки, аннотации, сведения об авторах и иных участниках и т.п.)
- технологические данные – сведения о языке, форматах и кодировках, а также сведения о местонахождении оригинального экземпляра описываемого документа
- статические параметры жизненного цикла – сведения о юридически значимых статусах, резолюциях, датах принятия, раскрытия, периодах действия и т.п., непосредственно отражаемых в содержимом документа или его реквизитах.
.6.3Назначение метаданных
В отличие от собственно данных (например, электронных документов), которые могут быть представлены в различной, как правило, неструктурированной форме, метаданные по определению являются строго структурированными. Метаданные отделяемы от описываемых ими данных, однако всегда содержат связь с исходными данными (например, адрес документа). Эти свойства определяют назначение и способы применения данных:
.6.3.1Поиск
В настоящее время как в глобальных информационных сетях, так и в корпоративных информационных системах, работающих с неструктурированной текстовой информацией (документами), преобладает т.н. контекстный или «полнотекстовый» подход к поиску. Однако он имеет существенные недостатки:
- проблемы с релевантностью. В большинстве случаев запрос содержит много поискового «мусора», не имеющего отношения к искомым документам.
- поиск по контексту не может обеспечить полноты, точности и связности выдаваемых результатов. Нельзя гарантировать, что в результаты будут включены все существующие документы по какому-то формальному критерию, трудно сортировать и группировать результаты по формальным критериям.
- сложный поиск, отчасти снижающий проблемы 1 и 2, требует высокой квалификации пользователя.
Для государственных систем это резко снижает применимость контекстного поиска. Кроме того, указанные проблемы резко возрастают при попытке использовать контекстный метод к нетекстовым объектам – например, рисункам, чертежам и т.п.
Использование поиска по метаданным позволяет преодолеть все эти проблемы, хотя усложняет процесс подготовки электронного документа, включая в него специальную стадию метаописания, в ходе которой квалифицированный пользователь должен структурно описать содержание, атрибуты и реквизиты каждого вновь созданного или отредактированного объекта. Взамен появляется возможность вести поиск по формальным признакам (например, по конкретному реквизиту документа), что невозможно при полнотекстовой индексации. Кроме того, поиск по метаданным производительнее и менее ресурсоемок.
.6.3.2Каталогизация
Из задач поиска прямо вытекает задача каталогизации – т.е. построения упорядоченных и удовлетворяющих требованию полноты по какому-либо критерию индексов. Такие индексы могут вестись не только создателями документов и системами, где они хранятся, но и внешними агентами, что позволяет организовать распределенный поиск (человек или система работают с централизованным каталогом, а, найдя нужный документ, связываются с нужным хранилищем).
Наличие структурированных описаний позволяет значительно автоматизировать эту операцию, так, например, удаленные системы могут формировать специфические тематические каталоги документов, публикуемых информационной системой центрального органа.
.6.3.3Информационный обмен
«Отчуждаемость» метаданных позволяет во многих случаях исключить из трафика систем собственно информационные объекты. Системы могут обмениваться метаданными, а при необходимости получения самого документа – запросить его из удаленного хранилища.
.6.3.4Обработка
Метаданные могут содержать не только описательные, относительно неизменные поля, но и динамически изменяющиеся сведения, связанные с жизненным циклом документа (например, отметки о просмотрах, согласования, резолюции, архивные метки). Таким образом, многие задачи документооборота могут быть сведены обменом «библиографическими карточками», на которых и ставятся необходимые отметки. При этом документ остается неизменным, что упрощает процедуру его электронной нотаризации и удостоверения.
.6.4Перечень применяемых спецификаций
Применяемые спецификации для представления метаданных определяются базовой спецификацией метаданных дублинского ядра:
DCMI Metadata Terms
Термины метаданных DCMI
e.org/documents/dcmi-terms/
Документ представляет собой текущую спецификацию всех терминов метаданных, поддерживаемых Dublin Core Metadata Initiative. Спецификация включает элементы, квалификаторы, схемы, справочники.
Dublin Core Metadata Element Set
Набор элементов метаданных Дублинского Ядра.
e.org/documents/dces/
Документ представляет собой справочное описание набора элементов метаданных Дублинского Ядра версии 1.1.
Guidelines for implementing Dublin Core in XML
Руководящие указания (рекомендации) для реализации Дублинского ядра в XML.
e.org/documents/2003/04/02/dc-xml-guidelines/
Документ предоставляет руководящие указания (рекомендации) для разработчиков XML-приложений, использующих метаданные Дублинского Ядра – как простого, так и с квалификаторами.
Схемы XML для поддержки рекомендаций по реализации DC в XML
e.org/schemas/xmls/
Dublin Core: e.org/schemas/xmls/qdc/2006/01/06/dc.xsd
DCMI Terms: e.org/schemas/xmls/qdc/2006/01/06/dcterms.xsd
DCMI Types: e.org/schemas/xmls/qdc/2006/01/06/dcmitype.xsd
Simple DC: e.org/schemas/xmls/qdc/2006/01/06/simpledc.xsd
Qualified DC: e.org/schemas/xmls/qdc/2006/01/06/qualifieddc.xsd