Отчет о научно-исследовательской работе по теме: №21 «Разработка рекомендаций по созданию и использованию единой системы объединеных государственных и муниципальных информационных ресурсов» (Заключительный)
Вид материала | Отчет |
- Отчет о научно-исследовательской работе, проведенной по заказу Министерства экономического, 6886.49kb.
- Отчет о научно-исследовательской работе разработка концепции Объединенных Государственных, 6757.77kb.
- Отчет о научно-исследовательской и опытно-конструкторской работе, 837.7kb.
- Отчет о научно-исследовательской работе контракт, 1195.26kb.
- Отчет о научно-исследовательской работе профессорско-преподавательского состава, 617.56kb.
- Отчет онаучно-исследовательской работе по теме: «Моделирование деятельности органов, 1105.18kb.
- Отчет онаучно-исследовательской работе по теме: «Моделирование деятельности органов, 2423.22kb.
- Отчет о научно-исследовательской и опытно-конструктороской работе, 3288.39kb.
- Отчет о научно-исследовательской работе (заключительный), 45.77kb.
- Отчет о научно-исследовательской работе по теме: разработка и внедрение генеральной, 1076.57kb.
1.3Методика интеграции ГИР на уровне информационных моделей
В распоряжении государства находятся огромные массивы информации и соответствующие системы, которые занимаются их обработкой. При этом выполнение таких задач государства как, например, оказание населению социальной помощи, медицинских услуг и т.д., требует поддержания высокого уровня информационного обмена между десятками ведомственных информационных систем.
Интеграция информационных ресурсов, как правило, связана с проблемами разнородности , первичных информационных ресурсов из различных источников, когда одни и те же предметные области описаны с использованием несогласованной онтологии. Принципиально важно, чтобы после загрузки данные об этих первичных ресурсах на основании индивидуальных признаков находили место в общепринятой для сообщества людей системе классификаторов и с этого момента они могли быть предоставлены пользователю в составе единого информационного пространства.
Комплекс проблем связан с формированием метаданных. Описания первичных информационных ресурсов производятся различными экспертами по различным схемам. Встают проблемы обеспечения глобальной однозначности семантики терминов, используемых при спецификации данных источников, из-за того, что различные пользователи могут использовать одинаковые термины в различном смысле и, наоборот, для одного и того же понятия – различные названия. Сбор метаданных – одна из основных проблем интеграции информационных ресурсов.
Метаданные имеют важное значение для обеспечения эффективности поиска информации (например, через портал), описания слабоструктурированной информации (документов), создания архивов с записями электронных документов.
В упрощенном виде метаданные – это данные (информация) об организации (представлении) других данных. Структурированные метаданные разделены на элементы, каждый из которых описывает один конкретный аспект информационных ресурсов. Использование метаданных необходимо для эффективного управления информацией и ее поиска. В самом широком смысле «метаданные» могут использоваться для описания структуры информации, включая такие моменты, как технические стандарты и политики взаимодействия.
Для унификации процедур представления метаданных в международном сообществе разработан ряд стандартов, определяющих единые подходы к описанию метаданных.
1.3.1Подходы к интеграции информационных ресурсов, принятые в международном сообществе
Многие страны взяли за основу так называемое «Дублинское ядро»20. Страны могут не только использовать это ядро, но и добавлять к нему любые дополнительные элементы, которые они считают необходимыми.
1.3.1.1Дублинское ядро (DUBLIN CORE)
Дублинское ядро - это международная и междисциплинарная попытка определить основной набор элементов описания информационных ресурсов. Стандарт метаданных Дублинского ядра (Dublin Core) - простой, но эффективный набор элементов для описания широкого спектра сетевых ресурсов. Стандарт включает в себя пятнадцать элементов, семантика которых была совместно определена международными междисциплинарными группами профессионалов в области библиотечного дела, вычислительной техники, кодирования текстов и специалистов других смежных областей исследования:
Заголовок (Title)
- Предмет (Subject)
- Описание (Description)
- Тип (Type)
- Источник (Source)
- Отношение (Relation)
- Освещение (Coverage)
- Создатель (Creator)
- Издатель (Publisher)
- Помощник (Contributor)
- Права (Rights)
- Дата (Date)
- Формат (Format)
- Идентификатор (Identifier)
- Язык (Language)
Dublin Core имеет целью реализацию следующих целей:
- Простота создания и поддержки. Набор элементов Dublin Core должен быть по возможности мал и прост для того, чтобы дать неспециалистам возможность с легкостью и минимальными затратами создавать записи описаний информационных ресурсов для обеспечения высокой эффективности нахождения этих ресурсов в сетевой среде.
- Легко понимаемая семантика. Обнаружение информации в Интернете весьма затруднено из-за различий в терминологии и практике описания, применяющейся в той или иной отрасли знания. Dublin Core может помочь найти индивидуальный путь с помощью общего набора элементов, семантика которых универсально понятна и поддерживается.
- Международный охват. Набор элементов Dublin Core разработан на английском языке, но созданы его версии и на многих других языках. Специальная группа "Многоязычный Dublin Core" координирует попытки связать эти версии в распределенном регистре, используя технологию «Формата описания ресурсов» 21(Resource Description Framework), разработанную Консорциумом W3C.
С 2003 года Дублинское ядро установлено международным стандартом ISO 15836:2003. Многие национальные системы стандартизации уже объявили о принятии Дублинского ядра в качестве национального стандарта.
Информационные ресурсы Интернет и различных информационных систем отличаются исключительным разнообразием. Поэтому единственное средство описания метаданных не может удовлетворить все потребности и решить все возникающие задачи. Практически все специалисты признают, что универсальность Дублинского ядра не всеобъемлюща, и для отдельных предметных областей есть острая потребность в локальных стандартах, учитывающих специфику отрасли – при использовании схожих подходов и принципов.
Исходя из этого, в международной и зарубежной практике создан целый ряд общих и специализированных систем метаданных, которые условно можно классифицировать следующим образом (Таблица 6).
Таблица 6: Классификация систем метаданных
Область применения | Стандарты, инициативы и системы метаданных |
Общие форматы метаданных | Dublin Core, vCard, iCalendar, Z39.87, PDM, ABC, CC/PP, EAGLES, ISO 6523, ISO 8211, ISO 11179, ISO 13250, METS, MPEG-7, MPEG-21, OIL, OIM, OWL |
Архивная информация | AIF, CWM, DDI, EAD, ISAD, OAIS, RKMS |
Библиографическая информация | MARC |
Географическая информация | CIP, CSDGM, DIGEST, GDF, GISEDI, Global Map, ISO 8211, NGDF, NTF, OpenGIS |
Дистанционное обучение | ADL, SCORM, IEEE, LOM, IMS, CP, IMS, Digital Repositories, IMS, LIP, IMS, QTI |
Медицинская информация | ACR/NEMA, DICOM, CDISC, ODM, HIDDEL, HL7, ISO TC215, MeSH |
Музейная информация | CDWA, MIDAS, Object ID, VRA |
Научная информация | CDF, CERIF, CIF, GRIB, HDF, JCAMP-DX, NetCDF, SEDRIS, VICAR |
Новостная информация | PRISM, NewsXML, RSS |
Экологическая информация | ETC/CDS DIF |
Административные метаданные | Object ID, PICS, P3P, RSS, ROADS |
Многие системы метаданных обеспечивают взаимодействие с Дублинским ядром. Общая схема взаимосвязи различных систем метаданных и разрабатываемых на их основе стандартов приведена на рисунке (Рис.21).
В целом же, для обеспечения взаимодействия систем метаданных на международном уровне обсуждаются возможности преодоления следующих негативных последствий:
- согласование разнообразных типов метаданных;
- противоречие между функциональностью и простотой;
- противоречие между возможностью расширения и интероперабельностью;
- создание и использование как человеком, так и компьютерами;
- функциональность, создание, администрирование и доступ, которые специфичны для каждого сообщества.
Рис.21. Схема взаимосвязи Дублинского ядра и других систем метаданных.22