Книги по разным темам Pages:     | 1 |   ...   | 24 | 25 | 26 | 27 | 28 |   ...   | 30 |

Например: если имеется не один, а несколько авторов, элемент DC.creator может повторяться. Квалифицированный (компетентный) уровень ДЯ добавляет элементы и вводит группу квалификаторов, позволяющих уточнить семантику базовых элементов.

Название элемента Описание элемента DC.audience Группа лиц, на которых ориентирован ресурс или которым (Аудитория) он может быть полезен DC.provenance Информация о возможных изменениях, внесенных с (Происхождение) момента создания ресурса.

DC.rightsHolder Определяет владельца прав на использование ресурса.

(Правообладатель) DC.instructionalMethod Учебный процесс, в котором может использоваться данный (Метод обучения) ресурс.

DC.accrualMethod Метод, с помощью которого ресурс добавляется в (Метод сбора) коллекцию.

DC.accrualPeriodicity Частота, с которой ресурс добавляется в коллекцию.

(Периодичность сбора) DC.accrualPolicy Политика, управляющая добавлением ресурса в (Политика сбора) коллекцию.

Квалификаторы позволяют более подробно описывать информацию, предоставляемую базовыми элементами. Они выражены в уточняющих элементах - элементах, которые конкретизируют определенные характеристики, и схемах кодирования - группах ссылок, служащих для интерпретации ценности элементов. Например: мы можем переделать описание данной главы и представить ее в следующей форме с большей детализацией:

DC.title=УЗначение использования метаданныхФ DC.creator=УMINERVA WP5 Quality Accessibility UsabilityФ DC.publisher=УMINERVA ProjectФ DC.type=УтекстФ DC.format=Уtext/htmlФ объем У62 kbФ DC.language=УruФ В приведенном выше описании мы указали, что тип ресурса - текст на основании стандартной схемы кодирования словаря типов DCMI, что его формат - text/html на основании стандарта MIME Type, и что язык - английский на основании стандарта. Мы также использовали элемент DC.extent (Протяженность), который позволяет нам определить размер ресурса. Структурирование расширяющего элемента говорит о том, что мы имеем дело со вспомогательным определением (уточнением) элемента формата.

Язык, определенный в соответствии со стандартом ДЯ, не зависит от каких-либо специальных стандартов, и мы можем выбирать терминологию, которая больше всего ему соответствует. К примеру, мы можем сделать так, чтобы элементы языка соответствовали полям таблицы БД или свойствам объекта на языке программирования. В любом случае DCMI дает нам некоторые указания, как использовать обычный синтаксис для описания онлайновых ресурсов, таких как веб-страницы. Их можно описать в терминах элементов ДЯ, выраженных <мета>метками в документе XHTML того же самого ресурса, цитируя источник/UTL принятой схемы. Например: данную главу можно описать с помощью следующего XHTML-кода, собрав метаданные в разделе (заголовок) исходного кода XHTML каждой страницы и используя элементы и :

В данном примере элементы указывают на схемы, используемые для элементов простого и квалифицированного ДЯ, а элемент соответствует элементным/ценностным парам, использованным в первых примерах. Там, где это возможно, данные отдельных элементов следует выбирать из нормализованного словаря - совокупности тщательно определенных терминов. Это позволит нам значительно улучшить результаты поиска, поскольку компьютеры могут идентифицировать отдельные слова, но им сложно понимать концепции, ассоциации, синонимы и пр.

Без определенного уровня терминологического контроля неполные или неправильные метаданные могут стать причиной низкого качества результатов поиска.

Нормализованные словари и тезаурусы можно использовать с помощью СХЕМ КОДИРОВАНИЯ.

Пример использования ДЯ на главной странице веб-сайта Музея Виктории и Альберта Зачастую ДЯ носит слишком общий характер. Чтобы представить точное описание очень специфических ресурсов; мы часто вынуждены персонализировать схему, чтобы выполнить определенное требование. Это приводит к таким ситуациям, когда даже в случае использования одинаковых стандартов, метаданные совместимы не явно, если не произвести картирование соответствующих профилей приложения. Несмотря на то, что это обстоятельство можно рассматривать как недостаток, оно, на самом деле, является достоинством ДЯ. Пользователь ДЯ не слишком ограничен описанием характеристик ресурса и может создавать более подробные описания, если того требует информация, подлежащая описанию.Dublin Core DCMI Metadata Terms Diane Hillmann, Using Dublin Core DCMI, Expressing Dublin Core in HTML/XHTML meta and link elements M. Moffat, СMarketingТ with Metadata: How Metadata Can Increase Exposure and Visibility of Online Content, Version 1.0 8th March 2006, 4.4 Другой способ представления ресурсов: агрегирование и RSS Другим способом представления информации о ресурсах является отделение ресурса (в нашем случае - главы) от его описания. При таком сценарии описание ресурса приводится в XML или RDF/XML во внешнем файле, присоединенном к самому ресурсу. Эта модель получила название лагрегирование. При агрегировании часто используется файловый О Дублинском ядре на русском языке: Википедия BE%D0%B5_%D1%8F%D0%B4%D1%80%D0%BE ; Российская национальная библиотека Прим. редактора формат RSS - форма XML, которая расшифровывается как Rich Site Summary (Сводка по информативному полнофункциональному веб-узлу), RDF Site Summary (Сводка по узлу RDF) или Really Simple Syndication (По-настоящему простое агрегирование). Файл RSS, известный также как RSS Feed или RSS Channel (RSS-канал), состоит из набора элементов (ЕДИНИЦ), каждый из которых содержит TITLE (Название), DESCRIPTION (Описание) и LINK (Ссылку) на веб-ресурс. Это - метаданные, причем сам контент абсолютно отделен, но доступен по ссылке в файле RSS.

Использование RSS Feed происходит мгновенно. После того, как RSS-файл становится доступным на веб-сайте, участники могут просто брать его с сайта и использовать его содержание повторно самыми разными способами. Существует несколько версий RSS, но приложения RSS поддерживают любую версию.

RSS Feed позволяет потенциальным пользователям видеть данные ряда поставщиков контента, не обязывая пользователей заходить на сайты этих поставщиков. Приведем пример: многие ежедневные газеты предлагают свою информацию с помощью RSSсистем (см. также 2.5.6.2 об организациях по культуре, предлагающих эту услугу).

Благодаря RSS Feed можно получать на свой компьютер обновления по последним новостям, опубликованным на сайте. Более того, любой человек, ведущий блог, может просто и быстро распространить через него новости, опубликованные в данной ежедневной газете.

Чтобы получить доступ к RSS-контенту путем выполнения нескольких несложных процедур, достаточно иметь выход в Интернет и специальную программу, называемую лагрегатором. Существует множество таких программ, их можно установить на свой ПК или подключиться к ним через Интернет. Некоторые агрегаторы можно встраивать в широко используемые браузеры и/или программы электронной почты.

4.4.1 FeedReader FeedReader - это программа, способная загрузить RSS (пользователь должен просто указать URL Feed для программы), провести ее синтаксический анализ и отобразить ее содержание с учетом предпочтений пользователя. Программа FeedReader часто обладает развитыми функциями. Например, она может автоматически находить обновления, сделанные производителем Feed, осуществляя их загрузки через равные промежутки времени.

Многие Feedreader можно бесплатно скачивать из сети165. В их число входят:

Х FeedReader (Windows) Х Sharpreader (Windows) Х Sage plug-ins (FireFox/ThunderBird) Х Urss plug-ins (Mozilla) Х Steaw (Linux) Х Netnewswire Lite (Mac OS X) Например (русскоязычный сайт). Прим.

редактора.

Пример RSS из Интернет-службы Великобритании л24-часовой музей 4.5 На пути к семантической интеграции Сеть - это не собрание документов. Это - группа "мест", созданных в виртуальном пространстве. "Места" в сети - это точки доступа для взаимодействия индивидов, организаций и индивидов с организациями.

Взаимодействие происходит при обмене информацией и документами и при доступе к услугам.

По этой причине основная проблема Сети заключается в нахождении искомых мест и в использовании имеющейся информации и услуг.

Поисковые машины (универсальные, OPAC166 или формы поиска веб-каталогов по культурному наследию) являются жизненно важными средствами перемещения в Сети, но они быстро становятся недостаточными: порой поиск может закончиться получением избыточного количества результатов, причем большая их часть оказывается совершенно бесполезной; а в другой раз можно не получить никаких результатов; результаты зависят от словаря, которым мы пользуемся (поиска по словам или цепочкам слов). Приведем пример: если мы ищем информацию по слову "сумчатый", то текстовая поисковая машина идентифицирует все страницы, на которых встречается слово "сумчатый" (именно в таком написании), даже если мы хотим, чтобы поисковая машина идентифицировала фотографию относящегося к сумчатым тасманийского волка на той странице, на которой слова "сумчатый" не упоминается.

Омонимию и тонкости языка (см. также 2.7) также следует принимать во внимание.

Например, слово сеть обозначает совершенно разные вещи для веб-дизайнера и для рыбака; скрипач - музыкант в оркестре, и его пальцы - часть его тела, но являются ли эти пальцы частью оркестра Если я скажу чайная ложечка в чашке, что я имею в виду: что Online Public Access Catalog www.opac.com. Прим. редактора ложечка находится внутри емкости или что она составляет часть материала, из которого сделана чашка Для переводчика-человека смысл сказанного становится понятным из контекста, поскольку мы мыслим дедуктивно. А что делать компьютеру Проблема заключается в том, что Всемирная Сеть была создана изначально для пользования только людьми, и даже если все, что в ней находится, машина (автоматический пользователь, см. 2.4.1.6) прочитать может, то понять эти данные она не сможет. По причине растущего объема информации в Сети управлять этой информацией вручную невозможно.

Одним из решений этой проблемы может быть создание метаданных для описания данных в Сети. Следует, однако, помнить, что разграничение данных и метаданных в Сети не является абсолютным; иногда ресурс как таковой можно интерпретировать одновременно двумя способами, а метаданные могут описывать другие метаданные.

Практически всегда данные и метаданные основаны на конкретном синтаксисе (логической структуре) во избежание двусмысленности.

Правильнее будет обучить машину устранять возможность неоднозначного толкования информации в Сети, например, путем создания и коллективного использования документов, которые собирают и выражают все концепции, формирующие знание, т.е.

онтологий.

Термин лонтология взят из философии и относится к науке описания определенного типа субъектов Вселенной и их взаимодействия друг с другом. Онтологии представляются наиболее эффективным способом представления знаний, однозначных описаний концепций определенного домена, иерархического описания отношений между самими концепциями, а также правил, необходимых для получения дополнительных знаний. Зачастую онтологии ограничены конкретными областями человеческого знания, так что термин может принимать какое-то одно определенное значение.

Общее решение, включающее кодирование, обмен и повторное использование структурированных метаданных, выражающих данные и представляющих правила построения данных, экспорт всего этого знания и предоставление его в доступ и для обмена любому приложению, называется семантический веб или семантическая паутина.

4.5.1 Семантическая паутина Тим Бернес-Ли, Джеймс Хендлер и Ора Лассила определили семантическую паутину как новую форму содержания Всемирной паутины, понятную компьютерам (The semantic web, Scientific American, May 2001)167.

Что это конкретно значит Это значит, что можно будет обнаруживать информацию и услуги, которые будут распознаваться по Унифицированному идентификатору ресурсов (URI), используя концепции, а не ключевые слова и открывая новые возможности для автоматизации услуг.

Перевод этой статьи см. ; о семантической паутине на русском языке см. Прим. редактора Для описания имеющихся в Сети данных машиной (в этом смысле исследователи используют слово семантический) следует определить модели представления знаний.

Семантическая паутина объединяет под общим названием W3C Semantic Web Activity различные принципы проектирования, рабочие группы и комплекс развивающихся технологий.

Основные сложности внедрения семантической паутины заключаются в определении и универсальном распространении стандартных форматов, обеспечивающих совместимость приложений и внедрение полностью автоматизированного способа дедуктивных заключений, экспортируя в Сеть правила из любой базы знаний.

На какой стадии мы находимся сейчас Некоторые элементы семантической паутины пока еще ждут своей реализации или понимания. Гипотетическая семантическая паутина Тима Бернерса-Ли пока еще функционировать не может. Однако себ-сайты, интранеты и экстранеты, предоставляющие информационные услуги, существуют во множестве.

Технологии, построенные на дескриптивной логике, уже готовы представлять знания в текстовой форме и предоставлять определенный уровень услуг по автоматическому рассуждению. Так что уже можно делать первые шаги в направлении семантической паутины, создавая простые приложения, основанные на дескриптивной логике и предоставляющие услуги для действующих веб-сайтов.

Pages:     | 1 |   ...   | 24 | 25 | 26 | 27 | 28 |   ...   | 30 |    Книги по разным темам