Автоматизированная система учета и реставрации архивных рукописных материалов Муромского историко-художественного музея

Вид материалаДокументы

Содержание


Рассмотрим дефекты, характерные для архивных рукописных материалов.
Файл/Открыть изображение
Обработка цветных изображений
Подобный материал:
Автоматизированная система учета и реставрации архивных рукописных материалов Муромского историко-художественного музея

Канунова Екатерина Евгеньевна

аспирант кафедры «Информационные системы»

Муромский Институт Владимирского Государственного Университета

Адрес: 602200, Муром, Владимирской обл. ул. Энгельса д. 15 кв. 90.

Тел: (809234) 35963

E-mail: asp_kat@rambler.ru


Садыков Султан Садыкович

д.т.н., профессор кафедры «Информационные системы»

Муромский Институт Владимирского Государственного Университета

Адрес: 602200, Муром, Владимирская обл. ул. Трудовая д. 21 кв. 92

Тел: д. (809234)49875 р. (809234)37222

E-mail: is@mivlgu.ru


В настоящее время интенсивно внедряются современные информационные технологии, обработка, хранение и передача информации во все сферы деятельности человека. Особое значение эти технологии имеют для хранения, реставрации и передачи на большие расстояния архивных документов. Во многих музеях и архивах мира осуществляется формирование компьютерных версий своих коллекций. Некоторые российские фирмы занимаются разработкой компьютерных музейных систем, предназначенных для учета архивных материалов и музейных коллекций. Так, например, в Муромском историко-художественном музее разработана автоматизированная система учета фондов (АСУФ), которая в настоящее время проходит тестирование в музее1.

Сегодня практически у каждого музея есть свой сайт в Интернете, который носит информативный и презентационный характер. Тем самым музеи предоставляют многим людям информацию о себе, о своей деятельности и о содержании своих фондов. Еще одним немаловажным направлением использования современных информационных технологий является автоматическая процедура реставрации архивных документов.

Архивные исторические документы, которые хранятся в Муромском историко-художественном музее имеют большую историческую ценность для работников различных учреждений, занимающихся изучением и исследованием истории Мурома и Муромского края. Они, наряду с музейными и библиотечными фондами составляют фундаментальный массив многоплановой информации о жизни и деятельности народов, использование этой информации - основа дальнейшего развития культуры и науки. При долгом хранении архивные документы приобретают значительные дефекты, которые способствуют потере их информативности. Так, например, в Муромском историко-художественном музее хранится около 140 рукописных книг с начала 16-ого по начало 19-ого века и около 2000 документов (векселей, дарственных грамот и т.п) с 16 по начало 20-ого века. Из них около 90 книг и 200 документов требуют восстановления. Проблема обеспечения сохранности и реставрации архивных документов является предметом исследования многих российских и зарубежных ученых. В Муромском музее в сотрудничестве с Муромским институтом Владимирского государственного университета ведется работа по созданию автоматизированной системы реставрации архивных материалов. К настоящему времени разработаны модули, предназначенные для устранения дефектов на рукописных и старопечатных книгах (документах). В ближайшем будущем предполагается дополнить систему модулями автоматизированной реставрации изображений фотодокументов.

Реставрация архивного текстового документа предусматривает восстановление текстовой информации в максимально близком к оригиналу виде, восстановление разрушенных участков основы документа или перенос текста на новый более долговечный носитель. В практике архивного дела применяются различные методы реставрации текстовых документов: ретушь, химический способ восстановления текстовой информации, электрографический метод восстановления текстов, оптико-фотографические методы и цифровые методы, т.е. автоматизированные.

Метод автоматической реставрации текстовых документов по сравнению с другими методами обладает рядом достоинств:

- позволяет устранять самые разнообразные дефекты (нерезкость, слабый контраст, пятна и т.д.);

- дает возможность исправления, как всего изображения документа, так и отдельных его участков;

- обеспечивает полную сохранность оригинала, так как преобразованиям подвергается не сам текстовый документ, а его электронная копия;

- позволяет многократно производить с заданной точностью любые преобразования изображения текстового документа;

- устраняет значительную часть трудоемких ручных операций.

Автоматическая реставрация состоит из следующих основных операций:

- оцифровка текстового документа;

- машинный анализ дефектов текстового материала;

- выбор способов для устранения дефекта на изображении;

- определение параметров обработки;

- обработка изображения текстового материала;

- контроль результатов реставрации;

- перевод отреставрированной цифровой копии документа на бумажную основу2.
Рассмотрим дефекты, характерные для архивных рукописных материалов.

Рукописный документ представляет собой систему, состоящую из носителя информации (бумага) и средств фиксации информации – красители, чернила, карандаш и т.п.

Вследствие этого дефекты рукописных материалов можно разделить на две основные группы:
  1. дефекты бумажной основы документа;
  2. дефекты, обуславливаемые средствами фиксации текстовой информации.

Дефекты бумажной основы:
  • дефекты, вызываемые деформацией бумаги: удлинение или усадка листа; коробление; скручивание
  • частичное или полное разрушение бумаги, повышенная ломкость и хрупкость
  • утрата отдельных частей листа бумаги (действие грызунов: отверстия на бумаге; обгрызание краев бумаги, корешков)
  • склеивание листов (основная причина – это плесневые грибы)
  • механические повреждения: складки, разрывы листов, следы частых перегибов, проколы
  • пожелтение бумаги (вследствие долгого хранения, зависит от свойств и состава бумаги)
  • пятна на бумаге (грязь, пигментные пятна, пятна, вызванные действием грибов, воск и т.п. )
  • коричневый цвет краев листа (обгоревшие, подмоченные и другие компоненты)

Дефекты, обуславливаемые средствами фиксации текстовой информации:
  • выцветание текста – естественное “темновое” локальное или по всему полю выцветание (музейный термин – “угасание” текста)
  • слабый контраст текстов
  • осыпание текста (вследствие появления складок, разрывов)
  • появление размазанных текстов (в следствие подмокания листов, повышенной влажности воздуха в местах хранения архивов)
  • нарушение конфигурации отдельных символов.
Следует отметить, что для визуального анализа рукописного материала достаточно выбрать следующие единичные показатели качества:
  1. контраст между штрихами текста и фоном изображения
  2. полнота информации, извлекаемая при чтении рукописного материала
  3. отсутствие помех – пятен, загрязнений, порывов, проколов и т.п.

С точки зрения реставрации можно выделить следующие виды дефектов:
  • слабый контраст текстов по всему полю документа или локальный;
  • неравномерность фона по всему полю документа или в локальных участках;
  • полупрозрачные пятна с постоянной прозрачностью;
  • непрозрачные пятна, разрывы;
  • мелкие полупрозрачные пятна в виде точек, крапа;
  • протяженные полупрозрачные пятна -складки листа;
  • протяженные непрозрачные пятна – разрывы;
  • мелкие полупрозрачные протяженные пятна – мелкие складки;
  • мелкие непрозрачные протяженные пятна - мелкие разрывы и царапины;
  • точечные дефекты, размером не более девяти пикселей;
  • проступание надписей с обратной стороны листа;
  • шум в виде неравномерных загрязнений листа;
  • ненужная информация (пометки, помарки и т.п.)3.

Для каждого, из рассмотренных видов дефектов разработана своя процедура их устранения. Основная задача, которая ставилась перед разработчиком системы – это в максимальной степени свести процесс реставрации документов к автоматическому режиму и тем самым оградить оператора от лишней работы.

Система автоматизированной реставрации включает несколько модулей:

- модуль поиска и устранения локальных дефектов (мелких, средних и крупных непрозрачных и полупрозрачных пятен; царапин; трещин; перегибов);

- модуль анализа изображений архивных материалов на контрастность;

- модуль восстановления контраста слабоконтрастных изображений архивных материалов (позволяет устранять локальное потускнение штрихов текста и по всему полю документа).

- модуль устранения проступаний надписей с обратной стороны листа на изображениях рукописных архивных материалов

Система работает в двух режимах: диалоговом и автоматизированном. Диалоговый режим реализован в виде надстройки графического редактора Adobe Photoshop в виде включения в него дополнительных фильтров, позволяющих устранять дефекты. Каждый фильтр представляет собой файл с расширением 8bf, который включает в себя процедуру реставрации определенного дефекта. Надстройка редактора производится простым копированием 8bf-файлов в подкаталог Plug-Ins рабочего каталога Adobe.

Автоматизированный режим реализован в виде отдельной программы, которая без дополнительных настроек ставится на компьютер пользователя и включает в себя все рассмотренные выше модули. Программа написана на языке программирования Object Pascal в среде визуального программирования Delphi. Система снабжена удобным и понятным для начинающего пользователя интерфейсом и предназначена для работы с ней хранителей рукописей, книг, фотографий и специалистов, занимающихся вопросами реставрации. Рабочая область системы включает разделы для просмотра исходных изображений документов в формате bmp и их фрагментов, разделы для просмотра обработанных изображений документов и их фрагментов, разделы для просмотра гистограмм распределений исходных и обработанных изображений. Естественно, если оператор не доволен работой алгоритма, то он может отменить те или действия при работе с изображениями.

Основные возможности системы:

- открытие изображений в формате bmp и сохранение обработанных изображений в любом формате (jpeg, bmp, tiff) (Меню Файл/Открыть изображение и Файл/Сохранить изображение). Отмена выполненной обработки (Меню Файл/Отменить );

- восстановление слабого контраста (Меню Восстановление контраста/С использованием опорных точек (для восстановления сильного выцветания); Восстановление контраста/Адаптивное коррекция (для восстановления неравномерного выцветания документов); Восстановление контраста/Локальное восстановление (для восстановления контраста в отдельных участках изображения); Восстановление контраста/Глобальное восстановление (для восстановления контраста по всему полю документа) и Восстановление контраста/ Анализ изображения на контрастность. Последний пункт меню предназначен для машинного анализа изображений и, в зависимости от типа изображения, выбора определенного алгоритма восстановления контраста. Т.е. пользователь может либо на основе визуального анализа выбрать тот или иной метод восстановления контраста, либо запустить процесс автоматического анализа и восстановления документа);

- устранение локальных дефектов (пятен, царапин, мелкого крапа и т.п.). Здесь также как и при восстановлении контраста, оператор может устранять локальные дефекты в ручную, т.е. выбора мышкой области на изображении, содержащей локальный дефект и выбора определенного пункта меню для его устранения, либо автоматически путем запуска процедуры поиска и устранения всех видов локальных дефектов. Ручной режим: (Меню Локальные дефекты/Устранение мелких пятен; Локальные дефекты/Устранение средних пятен округлой формы; Локальные дефекты/Устранение протяженных дефектов; Локальные дефекты/Устранение полупрозрачных дефектов; Локальные дефекты/Устранение непрозрачных дефектов). Автоматический режим: (Меню Локальные дефекты/Поиск и устранение);

- устранение проступания надписей с обратной стороны листа. Данный вид дефекта, наряду с локальными дефектами, очень часто встречается на архивных рукописных и старопечатных документах, поэтому его устранение также является актуальным (Меню Устранение проступания надписей);

- методы сегментации. Это отдельная группа модулей, задача которых устранение различных видов дефектов (это могут быть локальные дефекты, неравномерность фона, желтизна страниц, помарки, пометки и т.п.). (Меню Сегментация/Автоматическая классификация; Сегментация/Сегментация по гистограмме и Сегментация/Локальная сегментация – для устранения локальных дефектов, желтизны страниц, неравномерности фона;

- обработка цветных документов – (Меню Обработка цветных изображений) предназначена для устранения дефектов на изображениях цветных архивных документов и включает в себя методы сегментации цветных изображений, предназначенные для устранения локальных дефектов, желтизны страниц и восстановления контраста.

Следует заметить, что система не предназначена для реконструкции текстовых символов, так как это очень трудоемкий процесс, включает в себя методы распознавания образов, а распознать рукописные символы различных авторов определенных временных периодов очень сложно.

Пример реставрации изображения текстового документа, содержащего пятна приведен ниже.



Рисунок 1 – Изображение архивного текстового документа, содержащего пятна округлой формы




Рисунок 2 – Результат устранения пятен округлой формы


Рисунок 2 – Результат устранения пятен округлой формы




Список литературы
  1. Канунова Е.Е., Тюрина Е.К Автоматизированная система учета фондов – теория и практика.. Материалы шестой международной конференции ЕВА’2003.
  2. Садыков С.С., Канунова Е.Е. Вопросы устранения дефектов на архивных рукописных материалах../ Пенза симпозиум «Надежность и качество 2004»
  3. Канунова Е.Е., Садыков С.С. Дефекты рукописных архивных документов и возможные методы их устранения. Обработка информации: методы и системы: Сборник научных статей/ Под ред. Садыкова С.С., Андрианова Д.Е. – М.: Горячая линия – Телеком, 2003 г. – 231 с. (с. 9 - 12).