Проблемы и перспективы развития исторической информатики

Вид материалаАнализ

Содержание


Взаимосвязь линейного и нелинейного текстов
Н.Д. Москин (Петрозаводск)
А.В. Усачев (Красноярск)
Подобный материал:
1   ...   13   14   15   16   17   18   19   20   ...   70
^

Взаимосвязь линейного и нелинейного текстов


Говоря о соотношении линейного и нелинейного текстов в коммуникации необходимо отметить их неразрывную взаимосвязь. Историческое информационное пространство, моделируемое в виде гипертекста, соответствует понятию объекта исторической науки. Часть гипертекста - отекстованное событие (Ж. Деррида: "вне текста не существует ничего 1) - в соответствии с субъективно выдвинутой целью исследования представляет собой линейный текст, который можно рассматривать как своеобразную модель информационного пространства.

Линейный текст, подчинённый цели и произвольно выдвинутым задачам, соответствует особенностям мышления, которое не способно удерживать в поле своего внимания бесконечное множество отношений предмета исторического исследования. Поэтому, субъект деятельности вынужден сосредоточивать своё (и наше) внимание, только на тех отношениях, которые соответствуют его предварительно заявленной идеологической трактовке.

При попытке создания с помощью линейного текста исчерпывающей модели объекта исследования, становятся очевидными следующие тенденции:
  • скорость редукции представленных в линейных текстах знаний превышает скорость накопления новых фактов. Если суммировать всю совокупность линейных текстов, то объём фактов и событий в них окажется выше, чем в самом объекте исследования. Это объяснимо тем, что множество книг имеют много общих фрагментов
  • многочисленные ссылки на авторитеты, идеи которых изложены в книгах (свитках, на электронных носителях), превращают исторические тексты из научных в религиозные, основанные на доверии (вере) и не подлежат переосмыслению.

Тем не менее, несмотря на невозможность описать (охватить) объект исследования, линейный текст в силу своей завершённости (обращённости к прошлому опыту) остаётся наиболее понятным и доступным для осмысления. По мнению Субботина М.М. "нелинейно движущаяся мысль всё же фиксируется в линейном тексте 1. Идеологизация такого текста является необходимым предварительным условием его создания.

Гипертекст так же имеет слабые и сильные стороны. К преимуществам относятся:
  • объективность - отсутствие автора, проводящего понятную (первоначально) только ему идеологию, ориентированную на наличный прошлый опыт читателя. По выражению Р. Барта, можно говорить о "смерти автора 2. Гипертекст выступает как единство множества пересекающихся линейных текстов, где места пересечений - общие факты. Эти общие фрагменты отличаются объективностью, отсутствием авторской идеологии. Однако, порождаемый гипертекстовой моделью новый ("свой") линейный текст, представляет всего лишь новое развитие субъективной интерпретации истории
  • опора на отекстованное (и поэтому понятное человеку и машине) историческое пространство, а не авторитеты. В этом смысле гипертекст выступает как способ верификации накопленных знаний и практически исключает редукцию знаний
  • открытость для любого материала, в том числе из области смежных наук, поскольку имеет множество общих фрагментов.

Недостаток гипертекста - это не столько отсутствие сюжета, или даже рационального смысла, сколько принципиальная невозможность целостного прочтения. Некоторые исследователи склонны считать, что с точки зрения постмодернистов "история лишается любой внутренней связи и превращается в набор "отдельных историй", не связанных между собой и не предполагающих каких-либо связей преемственности 3. Первая часть этого утверждения справедлива. Однако, говоря о достоинствах и недостатках гипертекста, следует иметь в виду, что данная модель исторического информационного пространства - не есть самоцель исследователя, а всего лишь необходимый способ порождения нового линейного текста, новой идеологии.

Таким образом, трансформация одного линейного текста в другой является следствие его прохождения через гипертекстовую модель информационного пространства. На практике данная процедура может выглядеть следующим образом:

  1. Делинеаризация (фрагментация, деконструкция). Текстуальный анализа, при котором непосредственный или "поверхностный" смысл отбрасывается ради менее очевидного, представленного фактами и событиями
  2. Реконструкция событий из полученных фактов, а так же создание линейной (горизонтальной) навигации. Включает в себя уточнение последовательности, а так же систематизацию фрагментов по разделам (словари - события, хронология и календарь - факты, документы, литература, графика)
  3. Реконструкция фактов в события по вертикали" (создание навигаторов в фрагментах, приведение текстов в соответствие с техническими требованиями (таблицы, опорные конспекты, тесты)
  4. Линеаризация гипертекста в соответствии с потребностями пользователя – получение нового "своего") линейного текста.

Последовательно пройдя эти процедуры, мы получим качественно новый линейный текст, которому присущи все его недостатки. Но который, вместе с тем, поддаётся прочтению и эффективному усвоению.
^

Н.Д. Москин (Петрозаводск)

О публикации электронной коллекции фольклорных текстов
с помощью технологии XML


С 2001 года на кафедре информатики и математического обеспечения Петрозаводского государственного университета ведется работа по исследованию коллекций фольклорных текстов, представленных в электронной форме. Среди этих коллекций можно выделить корпус бесёдных песен Заонежья XIX – начала XX века, лужские песни из сборника «Песни городенского хора», духовные стихи о Голубиной книге из сборника Кирши Данилова и «Собрания народных песен П. В. Киреевского». Для формального представления лексической, синтаксической и семантической структуры подобных текстов можно использовать теоретико-графовые модели. В основе модели лежит понятие мотива, который, по выражению Б. Н. Путилова, является «узловой категорией художественной организации произведения фольклора». Содержательная основа мотива представляется в виде помеченного мультиграфа, в узлах которого находятся основные персонажи текста, животные, предметы обихода и т. д. Между объектами устанавливаются связи двух видов: локальные и глобальные, соответствующие синтагматическим и парадигматическим отношениям в тексте.

Подобную модель можно рассматривать с двух позиций. С одной стороны, это иерархическая структура, где основные мотивы делятся на более мелкие подмотивы, которые представляются упорядоченными графами. С другой стороны, если связать графы мотивов, объединив одинаковые объекты в одну вершину, то подобную структуру можно изобразить в виде сетевой модели – единого графа сюжета текста.

Для представления и анализа фольклорных текстов и их теоретико-графовых моделей, а также для дальнейшей публикации методики и результатов исследования в сети Интернет, необходимо разработать специальный формат хранения данных. На наш взгляд, реляционные базы данных, которые описывают информацию в виде таблиц «объект-признак», не совсем подходят для этой цели. Более удобным вариантом является использование расширяемого языка разметки XML. Данные в XML хранятся в упорядоченном виде, тексты отличаются простым синтаксисом, обеспечены бесплатными и общедоступными сопутствующими технологиями. Кроме того, именно XML в настоящее время является универсальным форматом для хранения и передачи информации в сетевых приложениях. В настоящее время эта технология все чаще находит свое применение в исторической информатике: здесь можно отметить стандарт для описания исторических событий HEML (org/), проект MEP для исследования документов по истории США (c.edu/), методику анализа средневековых документов комплекса «Moscowitica-Ruthenica» и др. Попытки использования XML можно обнаружить и в отдельных работах фольклористов: например, стандарт FolkML, предназначенный для описания сказочных сюжетов.

Для разметки фольклорных текстов и их теоретико-графовых моделей определим два типа элементов (тегов): основные характеристики текста (например, автор, собиратель, год и место записи, жанр, темп и т. д.) и структурные единицы текста (мотивы, объекты и их параметры, отношения между объектами, отдельные слова, словосочетания и предложения). Также в документе могут содержаться ссылки на графическое изображение источника, фрагменты звуковых записей (напевов), словарные статьи, в которых объясняются значения устаревших слов. Размеченный подобным образом фольклорный текст представляют собой интересный объект для дальнейшего изучения. С помощью математических методов и алгоритмов можно выделить наиболее важные закономерности сложения текста, наглядно визуализировать его семантическую структуру, осуществлять поиск по коллекции по принципу подобия мотивов, классифицировать тексты с помощью алгоритмов кластерного анализа.

В докладе будут представлены основные этапы построения XML-документов фольклорных текстов различных жанров, методика анализа этих документов, а также возможности для использования сопутствующих технологий XML, таких как XSLT, XML Query Language и т. д.
^

А.В. Усачев (Красноярск)