В. А. Капустин Содержание Формальные структуры текстовых документов 1 Курс лекций
Вид материала | Курс лекций |
Несколько вводных слов Элементы DocBook Элементы иерархии |
- Курс лекций по дисциплине " основы компьютерных технологий" Часть I. Microsoft Word, 432.92kb.
- Сферы использования текстовых документов, 52.06kb.
- Курс, 1-й семестр лекции (51 час), экзамен практикум на ЭВМ (68 часов), зачет (с оценкой), 24.4kb.
- Календарный план курса учебных занятий по спецкурсу «Формальные языки моделирования, 61.45kb.
- Тема: Создание документов в текстовых редакторах, 13.54kb.
- Н. Э. Баумана Кафедра Компьютерные системы и сети Г. С. Иванова, Т. Н. Ничушкина Оформление, 109.65kb.
- Формальные и неформальные структуры, их роль в организации содержание, 304.91kb.
- Текстовые редакторы это программы для создания и редактирования текстовых документов, 263.8kb.
- Курс лекций Преподаватель Михайлов Н. Л. Рыбинск 2001, 562.19kb.
- Курс лекций Барнаул 2001 удк 621. 385 Хмелев В. Н., Обложкина А. Д. Материаловедение, 1417.04kb.
DocBook
Несколько вводных слов
DocBook требует планирования структуры создаваемого текста. Хотя формально DocBook в состоянии обеспечивать разметку некоторых элементов бесструктурного текста, наиболее эффективно применение DocBook именно для текстов с предварительно продуманной структурой (это не значит, конечно, что эту структуру невозможно изменить в процессе работы над текстом). «Просто текст» (как в «Блокноте» или редакторах типа TextPad), также как и текст, подготавливаемый в текстовых процессорах типа Microsoft Word, также как и текст, подготавливаемый в виде HTML-страниц, вообще говоря, либо бесструктурны, либо (в случае Word/HTML) содержат смесь структурных и чисто оформительских компонентов. Отделение структуры от оформления в этих случаях требует существенных усилий (разработки стилей для всех структурных элементов). DocBook принципиально абстрагируется от оформления и описывает только структуру текста.
В результате автор не должен думать об оформлении и может сосредоточиться на собственно тексте, а дизайнер – думать только об оформлении.
У такого подхода есть оборотная сторона – такой подход приводит как к непростым техническим проблемам, так и проблемам нетехническим.
Технические проблемы включают прежде всего необходимость (как правило) нетривиальной обработки текста размеченного для получения текста оформленного. В настоящем курсе мы познакомимся с такой обработкой (XSLT). Вторая техническая проблема касается, в основном, именно документации и связана с управлением текстами. Дело в том, что различные компоненты документации часто используют одни и те же фрагменты текста. Обеспечить включение требуемого фрагмента текста с соблюдением структуры всего текста может быть непростой задачей.
Нетехнические проблемы связаны с необходимостью изменения подхода авторов к тексту. Планирование; написание текста в жестких рамках разработанной структуры; написание текста с целью его повторного использования в различных более широких контекстах требует от авторов выработки новых подходов к работе с текстом.
Решение и тех и других (технических и нетехнических) проблем облегчается при наличии соответствующих инструментов. Мы познакомимся с одним из них – Altova Authentic.
Элементы DocBook
DocBook – приложение XML. Это означает, что:
- существует DTD DocBook (для DocBook версий 4.* этого достаточно, для DocBook версий ≥5.0 применяется XML-схема),
- текст, подготовленный в формате DocBook, является XML-документом,
- этот XML-документ является не только правильно сформированным, но и правильным, т.е. структура его элементов соответствует DTD (и схеме).
Формально это означает, что изучение DocBook сводится к изучению сотен элементов, представленных в DTD DocBook. Фактически чаще всего применяются немногие из этих элементов, и поэтому можно начать изучение именно с них. Кроме того, элементы DocBook можно сгруппировать по характеру их использования. Именно с такой группировки мы и начнем знакомство с ними.
Итак, по характеру использования элементы DocBook распадаются на две группы:
- элементы иерархии
- элементы прозы (информационного пула, как называет их Норман Уолш)
Элементы иерархии определяют общую, наиболее грубую структуру текста. Элементы прозы определяют локальные структуры: списки, выделения (собственно выделения, замечания и т.п.), цитаты, примеры, уравнения, рисунки и др. Одна и та же иерархия может быть использована с разным текстом (и разными локальными структурами в нём), одни и те же фрагменты текста (с локальными структурами в нём) могут быть погружены в разные иерархии.
Элементы иерархии
Сначала я перечислю несколько элементов иерархии (элементам прозы будет посвящены последующие занятия):
- set – набор книг («собрание сочинений)
- book – книга
- part – часть
- reference – набор справочных записей, указатель
- preface; chapter; appendix; bibliography; glossary – предисловие; глава; приложение; список публикаций; словарь терминов
- article – статья
- section, sect1...sect5, simplesect – раздел; подраздел уровня 1...5; раздел, не имеющий подразделов
- refentry – элемент указателя
- refsect1...refsect3 – разделы указателя
Затем рассмотрим примеры:
Книга
PUBLIC "-//OASIS//DTD DocBook XML V4.3//EN"
"-open.org/docbook/xml/4.3/docbookx.dtd">
...
...
...
Статья
YPE article
PUBLIC "-//OASIS//DTD DocBook XML V4.3//EN"
"-open.org/docbook/xml/4.3/docbookx.dtd">
...
...
FAQ
PUBLIC "-//OASIS//DTD DocBook XML V4.3//EN"
"-open.org/docbook/xml/4.3/docbookx.dtd">
Question para 1
Question para 2
Answer para 1
Answer para 2
Why?
Why did the chicken cross the road?
To get to the other side
Some other silly reason I've forgotten.
Медиа-объекты
PUBLIC "-//OASIS//DTD DocBook XML V4.3//EN"
"-open.org/docbook/xml/4.3/docbookx.dtd">
Energy is equal to mass times the speed of
light squared.
E=mc2
Описание функции
PUBLIC "-//OASIS//DTD DocBook XML V4.3//EN"
"-open.org/docbook/xml/4.3/docbookx.dtd">
#include <pwd.h>
#include <sys/types.h>
const char *
name
uid_t
uid