Отчет о научно-исследовательской работе по теме: №21 «Разработка рекомендаций по созданию и использованию единой системы объединеных государственных и муниципальных информационных ресурсов» (Заключительный)

Вид материалаОтчет

Содержание


1.3Методика интеграции ГИР на уровне информационных моделей
1.3.1Подходы к интеграции информационных ресурсов, принятые в международном сообществе
1.3.1.1Дублинское ядро (DUBLIN CORE)
Легко понимаемая семантика
Международный охват
Область применения
Etc/cds dif
Рис.21. Схема взаимосвязи Дублинского ядра и других систем метаданных.
Подобный материал:
1   ...   4   5   6   7   8   9   10   11   ...   35

1.3Методика интеграции ГИР на уровне информационных моделей


В распоряжении государства находятся огромные массивы информации и соответствующие системы, которые занимаются их обработкой. При этом выполнение таких задач государства как, например, оказание населению социальной помощи, медицинских услуг и т.д., требует поддержания высокого уровня информационного обмена между десятками ведомственных информационных систем.

Интеграция информационных ресурсов, как правило, связана с проблемами разнородности , первичных информационных ресурсов из различных источников, когда одни и те же предметные области описаны с использованием несогласованной онтологии. Принципиально важно, чтобы после загрузки данные об этих первичных ресурсах на основании индивидуальных признаков находили место в общепринятой для сообщества людей системе классификаторов и с этого момента они могли быть предоставлены пользователю в составе единого информационного пространства.

Комплекс проблем связан с формированием метаданных. Описания первичных информационных ресурсов производятся различными экспертами по различным схемам. Встают проблемы обеспечения глобальной однозначности семантики терминов, используемых при спецификации данных источников, из-за того, что различные пользователи могут использовать одинаковые термины в различном смысле и, наоборот, для одного и того же понятия – различные названия. Сбор метаданных – одна из основных проблем интеграции информационных ресурсов.

Метаданные имеют важное значение для обеспечения эффективности поиска информации (например, через портал), описания слабоструктурированной информации (документов), создания архивов с записями электронных документов.

В упрощенном виде метаданные – это данные (информация) об организации (представлении) других данных. Структурированные метаданные разделены на элементы, каждый из которых описывает один конкретный аспект информационных ресурсов. Использование метаданных необходимо для эффективного управления информацией и ее поиска. В самом широком смысле «метаданные» могут использоваться для описания структуры информации, включая такие моменты, как технические стандарты и политики взаимодействия.

Для унификации процедур представления метаданных в международном сообществе разработан ряд стандартов, определяющих единые подходы к описанию метаданных.

1.3.1Подходы к интеграции информационных ресурсов, принятые в международном сообществе


Многие страны взяли за основу так называемое «Дублинское ядро»20. Страны могут не только использовать это ядро, но и добавлять к нему любые дополнительные элементы, которые они считают необходимыми.

1.3.1.1Дублинское ядро (DUBLIN CORE)


Дублинское ядро - это международная и междисциплинарная попытка определить основной набор элементов описания информационных ресурсов. Стандарт метаданных Дублинского ядра (Dublin Core) - простой, но эффективный набор элементов для описания широкого спектра сетевых ресурсов. Стандарт включает в себя пятнадцать элементов, семантика которых была совместно определена международными междисциплинарными группами профессионалов в области библиотечного дела, вычислительной техники, кодирования текстов и специалистов других смежных областей исследования:

  1. Заголовок (Title)
  2. Предмет (Subject)
  3. Описание (Description)
  4. Тип (Type)
  5. Источник (Source)
  6. Отношение (Relation)
  7. Освещение (Coverage)
  8. Создатель (Creator)
  9. Издатель (Publisher)
  10. Помощник (Contributor)
  11. Права (Rights)
  12. Дата (Date)
  13. Формат (Format)
  14. Идентификатор (Identifier)
  15. Язык (Language)

Dublin Core имеет целью реализацию следующих целей:
  • Простота создания и поддержки. Набор элементов Dublin Core должен быть по возможности мал и прост для того, чтобы дать неспециалистам возможность с легкостью и минимальными затратами создавать записи описаний информационных ресурсов для обеспечения высокой эффективности нахождения этих ресурсов в сетевой среде.
  • Легко понимаемая семантика. Обнаружение информации в Интернете весьма затруднено из-за различий в терминологии и практике описания, применяющейся в той или иной отрасли знания. Dublin Core может помочь найти индивидуальный путь с помощью общего набора элементов, семантика которых универсально понятна и поддерживается.
  • Международный охват. Набор элементов Dublin Core разработан на английском языке, но созданы его версии и на многих других языках. Специальная группа "Многоязычный Dublin Core" координирует попытки связать эти версии в распределенном регистре, используя технологию «Формата описания ресурсов» 21(Resource Description Framework), разработанную Консорциумом W3C.

С 2003 года Дублинское ядро установлено международным стандартом ISO 15836:2003. Многие национальные системы стандартизации уже объявили о принятии Дублинского ядра в качестве национального стандарта.

Информационные ресурсы Интернет и различных информационных систем отличаются исключительным разнообразием. Поэтому единственное средство описания метаданных не может удовлетворить все потребности и решить все возникающие задачи. Практически все специалисты признают, что универсальность Дублинского ядра не всеобъемлюща, и для отдельных предметных областей есть острая потребность в локальных стандартах, учитывающих специфику отрасли – при использовании схожих подходов и принципов.

Исходя из этого, в международной и зарубежной практике создан целый ряд общих и специализированных систем метаданных, которые условно можно классифицировать следующим образом (Таблица 6).

Таблица 6: Классификация систем метаданных

Область применения

Стандарты, инициативы и системы метаданных

Общие форматы метаданных

Dublin Core, vCard, iCalendar, Z39.87, PDM, ABC, CC/PP, EAGLES, ISO 6523, ISO 8211, ISO 11179, ISO 13250, METS, MPEG-7, MPEG-21, OIL, OIM, OWL

Архивная информация

AIF, CWM, DDI, EAD, ISAD, OAIS, RKMS

Библиографическая информация

MARC

Географическая информация

CIP, CSDGM, DIGEST, GDF, GISEDI, Global Map, ISO 8211, NGDF, NTF, OpenGIS

Дистанционное обучение

ADL, SCORM, IEEE, LOM, IMS, CP, IMS, Digital Repositories, IMS, LIP, IMS, QTI

Медицинская информация

ACR/NEMA, DICOM, CDISC, ODM, HIDDEL, HL7, ISO TC215, MeSH

Музейная информация

CDWA, MIDAS, Object ID, VRA

Научная информация

CDF, CERIF, CIF, GRIB, HDF, JCAMP-DX, NetCDF, SEDRIS, VICAR

Новостная информация

PRISM, NewsXML, RSS

Экологическая информация

ETC/CDS DIF

Административные метаданные

Object ID, PICS, P3P, RSS, ROADS


Многие системы метаданных обеспечивают взаимодействие с Дублинским ядром. Общая схема взаимосвязи различных систем метаданных и разрабатываемых на их основе стандартов приведена на рисунке (Рис.21).

В целом же, для обеспечения взаимодействия систем метаданных на международном уровне обсуждаются возможности преодоления следующих негативных последствий:
  • согласование разнообразных типов метаданных;
  • противоречие между функциональностью и простотой;
  • противоречие между возможностью расширения и интероперабельностью;
  • создание и использование как человеком, так и компьютерами;
  • функциональность, создание, администрирование и доступ, которые специфичны для каждого сообщества.



Рис.21. Схема взаимосвязи Дублинского ядра и других систем метаданных.22