В. А. Капустин Содержание Лекция

Вид материалаЛекция
Подобный материал:
1   2   3   4   5   6   7   8   9   10   ...   17

Вопросы

  1. Для чего нужен MARC?
  2. Можно ли использовать MARC для описания таких произведений искусства, как скульптуры?
  3. Можно ли использовать MARC для описания таких произведений искусства, как абстрактная живопись?
  4. Какие элементы данных используются для отображения на каталожной карточке?
  5. Что такое «шифр хранения»?
  6. Допустимо ли на каталожной карточке приводить описание артефакта в свободной форме?
  7. Чем основное и добавочное заглавия отличаются от точек доступа?
  8. Чем отличаются предметные рубрики и ключевые слова?
  9. Чем предметные рубрики отличаются от классификационных индексов?
  10. Перечислите основные требования к машинному формату каталогизационной (библиографической) записи.
  11. Какой коммуникационный формат используется как основа MARC?
  12. Использует ли MARC все возможности, предоставляемые Z39.2?
  13. Какова длина идентификатора подполя в MARC?
  14. Сколько индикаторов использует MARC?
  15. Можно ли с помощью MARC указать, что запись следует удалить?
  16. Можно ли с помощью MARC указать, что запись следует заменить на иную?
  17. Что такое «контрольный номер»?
  18. Какому артефакту соответствует тип записи j?
  19. Какому артефакту соответствует тип записи l?
  20. Какому артефакту соответствует тип записи r?
  21. Какой тип записи следует использовать при описании журнала?
  22. Какой тип записи следует использовать при выпуска журнала?
  23. Какой тип записи следует использовать при описании статьи в журнале?
  24. Назовите виды уровней описания, используемые в MARC.



Лекция 4.Структура записи RUSMARC


Продолжим наше знакомство со структурой записи стандарта MARC. Я буду приводить примеры, опуская лидер и справочник. Изложение охватывает не все поля и даже не все блоки полей, предусмотренные стандартом. Я буду останавливаться только на тех полях, которые иллюстрируют разнообразие атрибутов артефакта (конечно, прежде всего, из­да­ния), которые можно отразить, используя MARC, и разнообразие возможных требований к последующему представлению значений этих атрибутов. На первый взгляд, эти приме­ры выгля­дят устра­шающе. Рекомендую, всё-таки, попыта­ть­ся разобраться в первых при­мерах — в резуль­та­те дальше всё станет не таким сложным. Например, первые три сим­вола боль­шинства примеров — это три цифры метки поля. За ними идут два символа — два инди­катора, один из которых зачастую бывает пробелом. Далее начинается собст­вен­но поле, в кото­ром первый символ — ограничитель идентифи­каторов подполей ($), и.т.д.

Общие сведения о структуре записи MARC


При обсуждении полей/подполей фиксированной структуры мне придётся упоминать номера позиций символов. Для удобства я буду использовать общепринятое обозначе­ние, в котором вслед за меткой поля или идентификатором подполя ставится косая чер­та, а за ней — номер символьной позиции (октета) в поле/подполе, отсчитываемый от 0. Например, $6/0 обозначает первый символ подполя 6 (с идентификатором $6).

Справочник


Структура справочника записи MARC полностью соответствует Z39.2 — с учётом того, что в сегменте справочника присутствуют только три элемента (длина элемента, зависящего от приложения, в лидере записи задана равной 0):
  • Метка (3 октета)
  • Длина поля (4 октета)
  • Смещение поля относительно конца справочника (5 октетов)

Таким образом, метка поля MARC, как и полагается в соответствии с Z39.2, содержит 3 цифры, а максимальная длина одного поля равна 9999.

Разделители


Z39.2 использует непечатаемые символы для разделителей полей и записей. Чтобы об­суждать структуру полей и записей, приходится обозначать эти символы другими, име­ю­щими печатный образ.

Разделитель поля


В стандарте и в обсуждениях стандарта вместо \xEH (IS2 по ISO 646) как разделитель полей используется знак '@' («коммерческое AT»). Фактически IS2 заканчивает каждое поле в записи UNIMARC.

Конец записи


В стандарте и в обсуждениях стандарта вместо \xDH (IS3 по ISO 646) как обозначение конца записи используется знак процента '%'.

Идентификатор подполя


Как уже говорилось, для идентификаторов подполей MARC использует 2 символа. Чтобы механизм подполей работал, первый символ поля используется как разделитель, начина­ющий идентификатор подполя. В MARC в качестве такого символа принят знак '$'. Из этого соглашения есть два следствия:
  • Каждое поле, в котором возможны подполя (т.е. не управляющее поле перемен­ной длины), должно начинаться с '$'.
  • Значащая часть идентификатора подполя состоит из одного символа. Примеры см., например, ниже в разделе «Обработка альтернативной графики».

Пробел


Пробел при чтении часто упускается из вида. Поэтому MARC использует иной символ — '#' в тех случаях, когда нужно явно изобразить пробел.

Исключение из сортировки


Не следует упускать из вида, что записи MARC предназначены для загрузки в поисковые системы, которые, в свою очередь, нередко вынуждены сортировать эти записи по тем или иным полям, например, для создания поисковых индексов или для ранжирования записей как результатов поиска. Библиографические традиции предписывают не учиты­вать некоторые фрагменты данных при сортировке, вроде частиц в фамилиях и артиклей (см., например, упражнение 17 на стр. 18 в 7). Для указания таких исключаемых из сор­тировки фрагментов текста служат два символа \x88 — начало исключаемого фрагмента, — и \x89 — конец исключаемого фрагмента6. При обсуждении стандарта используются обозначения ≠NSB≠ (non-sorting begin) и ≠NSE≠ (non-sorting end), соответственно.

Блоки полей


Все поля MARC делятся на блоки. Метки полей каждого блока имеют одинаковую пер­вую цифру, что в документации и при обсуждении стандарта часто записывается как Nxx или N--. Например, 2xx — это и есть все поля блока описательной информации.
  • 0 — Блок идентификации
  • 1 — Блок кодированной информации
  • 2 — Блок описательной информации
  • 3 — Блок примечаний
  • 4 — Блок связи записей
  • 5 — Блок взаимосвязанных заглавий
  • 6 — Блок анализа содержания
  • 7 — Блок интеллектуальной ответственности
  • 8 — Блок международного использования
  • 9 — Блок локального использования

Блоки, как правило, содержат поля переменной длины (в RUSMARC почему-то именуе­мые «переменными полями»). Исключение составляют большинство полей блока 0 и все поля блока 1 — эти поля имеют фиксированную длину и в стандарте называются «фиксированными».

Поля, имеющие префикс 00 (поля подблока 00-) называются в стандарте «управляемы­ми» (хотя более правильный перевод термина “control filed” — управляющее поле). Эти поля бесструктурны.