Автоматизированная система учета и реставрации архивных рукописных материалов Муромского историко-художественного музея
Вид материала | Документы |
СодержаниеРассмотрим дефекты, характерные для архивных рукописных материалов. Файл/Открыть изображение Обработка цветных изображений |
- Выставка работает до 12 июня 2011, 100.5kb.
- Программа выставки-ярмарки день первый 7 января 11. 00 Площадь у историко-художественного, 96.96kb.
- Автоматизированная система учета библиотечного фонда, 31.31kb.
- Организация и методика деятельности негосударственных архивов, 79.14kb.
- Нургалеева Розалия Миргалимовна (директор Государственного музея изобразительных искусств, 150.47kb.
- Аспектно-маркерная модель реферата дипломного проекта, 18.16kb.
- Обучающий семинар-тренинг, 250.13kb.
- Вопросы интеграции информационных ресурсов в деятельности художественного музея, 103.05kb.
- Автоматизированная информационно-поисковая система, 345.58kb.
- Планирование энергопотребления; Расчет необходимых параметров систем энергоснабжения, 41.85kb.
Автоматизированная система учета и реставрации архивных рукописных материалов Муромского историко-художественного музея
Канунова Екатерина Евгеньевна
аспирант кафедры «Информационные системы»
Муромский Институт Владимирского Государственного Университета
Адрес: 602200, Муром, Владимирской обл. ул. Энгельса д. 15 кв. 90.
Тел: (809234) 35963
E-mail: asp_kat@rambler.ru
Садыков Султан Садыкович
д.т.н., профессор кафедры «Информационные системы»
Муромский Институт Владимирского Государственного Университета
Адрес: 602200, Муром, Владимирская обл. ул. Трудовая д. 21 кв. 92
Тел: д. (809234)49875 р. (809234)37222
E-mail: is@mivlgu.ru
В настоящее время интенсивно внедряются современные информационные технологии, обработка, хранение и передача информации во все сферы деятельности человека. Особое значение эти технологии имеют для хранения, реставрации и передачи на большие расстояния архивных документов. Во многих музеях и архивах мира осуществляется формирование компьютерных версий своих коллекций. Некоторые российские фирмы занимаются разработкой компьютерных музейных систем, предназначенных для учета архивных материалов и музейных коллекций. Так, например, в Муромском историко-художественном музее разработана автоматизированная система учета фондов (АСУФ), которая в настоящее время проходит тестирование в музее1.
Сегодня практически у каждого музея есть свой сайт в Интернете, который носит информативный и презентационный характер. Тем самым музеи предоставляют многим людям информацию о себе, о своей деятельности и о содержании своих фондов. Еще одним немаловажным направлением использования современных информационных технологий является автоматическая процедура реставрации архивных документов.
Архивные исторические документы, которые хранятся в Муромском историко-художественном музее имеют большую историческую ценность для работников различных учреждений, занимающихся изучением и исследованием истории Мурома и Муромского края. Они, наряду с музейными и библиотечными фондами составляют фундаментальный массив многоплановой информации о жизни и деятельности народов, использование этой информации - основа дальнейшего развития культуры и науки. При долгом хранении архивные документы приобретают значительные дефекты, которые способствуют потере их информативности. Так, например, в Муромском историко-художественном музее хранится около 140 рукописных книг с начала 16-ого по начало 19-ого века и около 2000 документов (векселей, дарственных грамот и т.п) с 16 по начало 20-ого века. Из них около 90 книг и 200 документов требуют восстановления. Проблема обеспечения сохранности и реставрации архивных документов является предметом исследования многих российских и зарубежных ученых. В Муромском музее в сотрудничестве с Муромским институтом Владимирского государственного университета ведется работа по созданию автоматизированной системы реставрации архивных материалов. К настоящему времени разработаны модули, предназначенные для устранения дефектов на рукописных и старопечатных книгах (документах). В ближайшем будущем предполагается дополнить систему модулями автоматизированной реставрации изображений фотодокументов.
Реставрация архивного текстового документа предусматривает восстановление текстовой информации в максимально близком к оригиналу виде, восстановление разрушенных участков основы документа или перенос текста на новый более долговечный носитель. В практике архивного дела применяются различные методы реставрации текстовых документов: ретушь, химический способ восстановления текстовой информации, электрографический метод восстановления текстов, оптико-фотографические методы и цифровые методы, т.е. автоматизированные.
Метод автоматической реставрации текстовых документов по сравнению с другими методами обладает рядом достоинств:
- позволяет устранять самые разнообразные дефекты (нерезкость, слабый контраст, пятна и т.д.);
- дает возможность исправления, как всего изображения документа, так и отдельных его участков;
- обеспечивает полную сохранность оригинала, так как преобразованиям подвергается не сам текстовый документ, а его электронная копия;
- позволяет многократно производить с заданной точностью любые преобразования изображения текстового документа;
- устраняет значительную часть трудоемких ручных операций.
Автоматическая реставрация состоит из следующих основных операций:
- оцифровка текстового документа;
- машинный анализ дефектов текстового материала;
- выбор способов для устранения дефекта на изображении;
- определение параметров обработки;
- обработка изображения текстового материала;
- контроль результатов реставрации;
- перевод отреставрированной цифровой копии документа на бумажную основу2.
Рассмотрим дефекты, характерные для архивных рукописных материалов.
Рукописный документ представляет собой систему, состоящую из носителя информации (бумага) и средств фиксации информации – красители, чернила, карандаш и т.п.
Вследствие этого дефекты рукописных материалов можно разделить на две основные группы:
- дефекты бумажной основы документа;
- дефекты, обуславливаемые средствами фиксации текстовой информации.
Дефекты бумажной основы:
- дефекты, вызываемые деформацией бумаги: удлинение или усадка листа; коробление; скручивание
- частичное или полное разрушение бумаги, повышенная ломкость и хрупкость
- утрата отдельных частей листа бумаги (действие грызунов: отверстия на бумаге; обгрызание краев бумаги, корешков)
- склеивание листов (основная причина – это плесневые грибы)
- механические повреждения: складки, разрывы листов, следы частых перегибов, проколы
- пожелтение бумаги (вследствие долгого хранения, зависит от свойств и состава бумаги)
- пятна на бумаге (грязь, пигментные пятна, пятна, вызванные действием грибов, воск и т.п. )
- коричневый цвет краев листа (обгоревшие, подмоченные и другие компоненты)
Дефекты, обуславливаемые средствами фиксации текстовой информации:
- выцветание текста – естественное “темновое” локальное или по всему полю выцветание (музейный термин – “угасание” текста)
- слабый контраст текстов
- осыпание текста (вследствие появления складок, разрывов)
- появление размазанных текстов (в следствие подмокания листов, повышенной влажности воздуха в местах хранения архивов)
- нарушение конфигурации отдельных символов.
Следует отметить, что для визуального анализа рукописного материала достаточно выбрать следующие единичные показатели качества:
- контраст между штрихами текста и фоном изображения
- полнота информации, извлекаемая при чтении рукописного материала
- отсутствие помех – пятен, загрязнений, порывов, проколов и т.п.
С точки зрения реставрации можно выделить следующие виды дефектов:
- слабый контраст текстов по всему полю документа или локальный;
- неравномерность фона по всему полю документа или в локальных участках;
- полупрозрачные пятна с постоянной прозрачностью;
- непрозрачные пятна, разрывы;
- мелкие полупрозрачные пятна в виде точек, крапа;
- протяженные полупрозрачные пятна -складки листа;
- протяженные непрозрачные пятна – разрывы;
- мелкие полупрозрачные протяженные пятна – мелкие складки;
- мелкие непрозрачные протяженные пятна - мелкие разрывы и царапины;
- точечные дефекты, размером не более девяти пикселей;
- проступание надписей с обратной стороны листа;
- шум в виде неравномерных загрязнений листа;
- ненужная информация (пометки, помарки и т.п.)3.
Для каждого, из рассмотренных видов дефектов разработана своя процедура их устранения. Основная задача, которая ставилась перед разработчиком системы – это в максимальной степени свести процесс реставрации документов к автоматическому режиму и тем самым оградить оператора от лишней работы.
Система автоматизированной реставрации включает несколько модулей:
- модуль поиска и устранения локальных дефектов (мелких, средних и крупных непрозрачных и полупрозрачных пятен; царапин; трещин; перегибов);
- модуль анализа изображений архивных материалов на контрастность;
- модуль восстановления контраста слабоконтрастных изображений архивных материалов (позволяет устранять локальное потускнение штрихов текста и по всему полю документа).
- модуль устранения проступаний надписей с обратной стороны листа на изображениях рукописных архивных материалов
Система работает в двух режимах: диалоговом и автоматизированном. Диалоговый режим реализован в виде надстройки графического редактора Adobe Photoshop в виде включения в него дополнительных фильтров, позволяющих устранять дефекты. Каждый фильтр представляет собой файл с расширением 8bf, который включает в себя процедуру реставрации определенного дефекта. Надстройка редактора производится простым копированием 8bf-файлов в подкаталог Plug-Ins рабочего каталога Adobe.
Автоматизированный режим реализован в виде отдельной программы, которая без дополнительных настроек ставится на компьютер пользователя и включает в себя все рассмотренные выше модули. Программа написана на языке программирования Object Pascal в среде визуального программирования Delphi. Система снабжена удобным и понятным для начинающего пользователя интерфейсом и предназначена для работы с ней хранителей рукописей, книг, фотографий и специалистов, занимающихся вопросами реставрации. Рабочая область системы включает разделы для просмотра исходных изображений документов в формате bmp и их фрагментов, разделы для просмотра обработанных изображений документов и их фрагментов, разделы для просмотра гистограмм распределений исходных и обработанных изображений. Естественно, если оператор не доволен работой алгоритма, то он может отменить те или действия при работе с изображениями.
Основные возможности системы:
- открытие изображений в формате bmp и сохранение обработанных изображений в любом формате (jpeg, bmp, tiff) (Меню Файл/Открыть изображение и Файл/Сохранить изображение). Отмена выполненной обработки (Меню Файл/Отменить );
- восстановление слабого контраста (Меню Восстановление контраста/С использованием опорных точек (для восстановления сильного выцветания); Восстановление контраста/Адаптивное коррекция (для восстановления неравномерного выцветания документов); Восстановление контраста/Локальное восстановление (для восстановления контраста в отдельных участках изображения); Восстановление контраста/Глобальное восстановление (для восстановления контраста по всему полю документа) и Восстановление контраста/ Анализ изображения на контрастность. Последний пункт меню предназначен для машинного анализа изображений и, в зависимости от типа изображения, выбора определенного алгоритма восстановления контраста. Т.е. пользователь может либо на основе визуального анализа выбрать тот или иной метод восстановления контраста, либо запустить процесс автоматического анализа и восстановления документа);
- устранение локальных дефектов (пятен, царапин, мелкого крапа и т.п.). Здесь также как и при восстановлении контраста, оператор может устранять локальные дефекты в ручную, т.е. выбора мышкой области на изображении, содержащей локальный дефект и выбора определенного пункта меню для его устранения, либо автоматически путем запуска процедуры поиска и устранения всех видов локальных дефектов. Ручной режим: (Меню Локальные дефекты/Устранение мелких пятен; Локальные дефекты/Устранение средних пятен округлой формы; Локальные дефекты/Устранение протяженных дефектов; Локальные дефекты/Устранение полупрозрачных дефектов; Локальные дефекты/Устранение непрозрачных дефектов). Автоматический режим: (Меню Локальные дефекты/Поиск и устранение);
- устранение проступания надписей с обратной стороны листа. Данный вид дефекта, наряду с локальными дефектами, очень часто встречается на архивных рукописных и старопечатных документах, поэтому его устранение также является актуальным (Меню Устранение проступания надписей);
- методы сегментации. Это отдельная группа модулей, задача которых устранение различных видов дефектов (это могут быть локальные дефекты, неравномерность фона, желтизна страниц, помарки, пометки и т.п.). (Меню Сегментация/Автоматическая классификация; Сегментация/Сегментация по гистограмме и Сегментация/Локальная сегментация – для устранения локальных дефектов, желтизны страниц, неравномерности фона;
- обработка цветных документов – (Меню Обработка цветных изображений) предназначена для устранения дефектов на изображениях цветных архивных документов и включает в себя методы сегментации цветных изображений, предназначенные для устранения локальных дефектов, желтизны страниц и восстановления контраста.
Следует заметить, что система не предназначена для реконструкции текстовых символов, так как это очень трудоемкий процесс, включает в себя методы распознавания образов, а распознать рукописные символы различных авторов определенных временных периодов очень сложно.
Пример реставрации изображения текстового документа, содержащего пятна приведен ниже.
Рисунок 1 – Изображение архивного текстового документа, содержащего пятна округлой формы | Рисунок 2 – Результат устранения пятен округлой формы Рисунок 2 – Результат устранения пятен округлой формы |
Список литературы
- Канунова Е.Е., Тюрина Е.К Автоматизированная система учета фондов – теория и практика.. Материалы шестой международной конференции ЕВА’2003.
- Садыков С.С., Канунова Е.Е. Вопросы устранения дефектов на архивных рукописных материалах../ Пенза симпозиум «Надежность и качество 2004»
- Канунова Е.Е., Садыков С.С. Дефекты рукописных архивных документов и возможные методы их устранения. Обработка информации: методы и системы: Сборник научных статей/ Под ред. Садыкова С.С., Андрианова Д.Е. – М.: Горячая линия – Телеком, 2003 г. – 231 с. (с. 9 - 12).