В. А. Капустин Содержание Лекция
Вид материала | Лекция |
- В. А. Капустин Содержание Формальные структуры текстовых документов 1 Курс лекций, 1163.92kb.
- Содержание разделов дисциплины, объем в лекционных часах-60 часов, 48.53kb.
- Содержание: Лекция Становление экономической цивилизации. Стр., 23.46kb.
- Учебно-методический комплекс по дисциплине «Международное публичное право» Автор-составитель, 463.79kb.
- Улучшение смазывающих свойств дизельных топлив, 106.59kb.
- «University Library» Editorial Council, 8102.22kb.
- Ахромеева Т. С., Капустин М. А., Кащенко С. А., Куракин П. В., Малинецкий Г. Г., Медведев И., 459.22kb.
- «Социальная стратификация и социальная мобильность», 46.19kb.
- Лесохозяйственный регламент, 3846.17kb.
- Наименование и краткое содержание лекций № Тема лекций. Краткое содержание. Количество, 67.09kb.
Вопросы
- Для чего нужен MARC?
- Можно ли использовать MARC для описания таких произведений искусства, как скульптуры?
- Можно ли использовать MARC для описания таких произведений искусства, как абстрактная живопись?
- Какие элементы данных используются для отображения на каталожной карточке?
- Что такое «шифр хранения»?
- Допустимо ли на каталожной карточке приводить описание артефакта в свободной форме?
- Чем основное и добавочное заглавия отличаются от точек доступа?
- Чем отличаются предметные рубрики и ключевые слова?
- Чем предметные рубрики отличаются от классификационных индексов?
- Перечислите основные требования к машинному формату каталогизационной (библиографической) записи.
- Какой коммуникационный формат используется как основа MARC?
- Использует ли MARC все возможности, предоставляемые Z39.2?
- Какова длина идентификатора подполя в MARC?
- Сколько индикаторов использует MARC?
- Можно ли с помощью MARC указать, что запись следует удалить?
- Можно ли с помощью MARC указать, что запись следует заменить на иную?
- Что такое «контрольный номер»?
- Какому артефакту соответствует тип записи j?
- Какому артефакту соответствует тип записи l?
- Какому артефакту соответствует тип записи r?
- Какой тип записи следует использовать при описании журнала?
- Какой тип записи следует использовать при выпуска журнала?
- Какой тип записи следует использовать при описании статьи в журнале?
- Назовите виды уровней описания, используемые в MARC.
Лекция 4.Структура записи RUSMARC
Продолжим наше знакомство со структурой записи стандарта MARC. Я буду приводить примеры, опуская лидер и справочник. Изложение охватывает не все поля и даже не все блоки полей, предусмотренные стандартом. Я буду останавливаться только на тех полях, которые иллюстрируют разнообразие атрибутов артефакта (конечно, прежде всего, издания), которые можно отразить, используя MARC, и разнообразие возможных требований к последующему представлению значений этих атрибутов. На первый взгляд, эти примеры выглядят устрашающе. Рекомендую, всё-таки, попытаться разобраться в первых примерах — в результате дальше всё станет не таким сложным. Например, первые три символа большинства примеров — это три цифры метки поля. За ними идут два символа — два индикатора, один из которых зачастую бывает пробелом. Далее начинается собственно поле, в котором первый символ — ограничитель идентификаторов подполей ($), и.т.д.
Общие сведения о структуре записи MARC
При обсуждении полей/подполей фиксированной структуры мне придётся упоминать номера позиций символов. Для удобства я буду использовать общепринятое обозначение, в котором вслед за меткой поля или идентификатором подполя ставится косая черта, а за ней — номер символьной позиции (октета) в поле/подполе, отсчитываемый от 0. Например, $6/0 обозначает первый символ подполя 6 (с идентификатором $6).
Справочник
Структура справочника записи MARC полностью соответствует Z39.2 — с учётом того, что в сегменте справочника присутствуют только три элемента (длина элемента, зависящего от приложения, в лидере записи задана равной 0):
- Метка (3 октета)
- Длина поля (4 октета)
- Смещение поля относительно конца справочника (5 октетов)
Таким образом, метка поля MARC, как и полагается в соответствии с Z39.2, содержит 3 цифры, а максимальная длина одного поля равна 9999.
Разделители
Z39.2 использует непечатаемые символы для разделителей полей и записей. Чтобы обсуждать структуру полей и записей, приходится обозначать эти символы другими, имеющими печатный образ.
Разделитель поля
В стандарте и в обсуждениях стандарта вместо \xEH (IS2 по ISO 646) как разделитель полей используется знак '@' («коммерческое AT»). Фактически IS2 заканчивает каждое поле в записи UNIMARC.
Конец записи
В стандарте и в обсуждениях стандарта вместо \xDH (IS3 по ISO 646) как обозначение конца записи используется знак процента '%'.
Идентификатор подполя
Как уже говорилось, для идентификаторов подполей MARC использует 2 символа. Чтобы механизм подполей работал, первый символ поля используется как разделитель, начинающий идентификатор подполя. В MARC в качестве такого символа принят знак '$'. Из этого соглашения есть два следствия:
- Каждое поле, в котором возможны подполя (т.е. не управляющее поле переменной длины), должно начинаться с '$'.
- Значащая часть идентификатора подполя состоит из одного символа. Примеры см., например, ниже в разделе «Обработка альтернативной графики».
Пробел
Пробел при чтении часто упускается из вида. Поэтому MARC использует иной символ — '#' в тех случаях, когда нужно явно изобразить пробел.
Исключение из сортировки
Не следует упускать из вида, что записи MARC предназначены для загрузки в поисковые системы, которые, в свою очередь, нередко вынуждены сортировать эти записи по тем или иным полям, например, для создания поисковых индексов или для ранжирования записей как результатов поиска. Библиографические традиции предписывают не учитывать некоторые фрагменты данных при сортировке, вроде частиц в фамилиях и артиклей (см., например, упражнение 17 на стр. 18 в 7). Для указания таких исключаемых из сортировки фрагментов текста служат два символа \x88 — начало исключаемого фрагмента, — и \x89 — конец исключаемого фрагмента6. При обсуждении стандарта используются обозначения ≠NSB≠ (non-sorting begin) и ≠NSE≠ (non-sorting end), соответственно.
Блоки полей
Все поля MARC делятся на блоки. Метки полей каждого блока имеют одинаковую первую цифру, что в документации и при обсуждении стандарта часто записывается как Nxx или N--. Например, 2xx — это и есть все поля блока описательной информации.
- 0 — Блок идентификации
- 1 — Блок кодированной информации
- 2 — Блок описательной информации
- 3 — Блок примечаний
- 4 — Блок связи записей
- 5 — Блок взаимосвязанных заглавий
- 6 — Блок анализа содержания
- 7 — Блок интеллектуальной ответственности
- 8 — Блок международного использования
- 9 — Блок локального использования
Блоки, как правило, содержат поля переменной длины (в RUSMARC почему-то именуемые «переменными полями»). Исключение составляют большинство полей блока 0 и все поля блока 1 — эти поля имеют фиксированную длину и в стандарте называются «фиксированными».
Поля, имеющие префикс 00 (поля подблока 00-) называются в стандарте «управляемыми» (хотя более правильный перевод термина “control filed” — управляющее поле). Эти поля бесструктурны.