«справочные издания о населении и природе тамбовской области XIX-XX вв.»: Некоторые аспекты технологии создания

Вид материалаДокументы
Подобный материал:
ИНФОРМАЦИОННО-ПОИСКОВАЯ СИСТЕМА «СПРАВОЧНЫЕ ИЗДАНИЯ О НАСЕЛЕНИИ И ПРИРОДЕ ТАМБОВСКОЙ ОБЛАСТИ XIX-XX ВВ.»: НЕКОТОРЫЕ АСПЕКТЫ ТЕХНОЛОГИИ СОЗДАНИЯ


Л.А.Пронина, Н.Е.Копытова, Н.В.Шаталова, А.Н.Евстигнеев

Работа выполнена при поддержке РГНФ, проект № 08-01-12107в


Электронные ресурсы занимают все более важное место в системе информационного обеспечения науки и практики. Традиционно одним из достоверных источников информации считаются справочные издания, поэтому велика популярность и справочных баз данных. Современная тенденция в развитии электронных ресурсов, на наш взгляд, – это создание мощных интегрированных информационно-поисковых систем с разнообразным и разнородным контентом, обладающих мощными поисковыми возможностями. В последние годы в нашей стране появился интересный опыт создания электронных ресурсов: в качестве инструмента и, одновременно, среды интеграции информационных ресурсов культуры региона (публичных библиотек, культурных центров, музеев и архивов) предлагается электронная энциклопедия. Фирма ОАО «Альт-Софт» разработала программно-технологический комплекс КАИСА-Энциклопедия, методологию создания многоязычных энциклопедических ресурсов и систему справочников-указателей, которые организуют связи между информационными объектами и обеспечивают многоаспектный эффективный поиск с использованием многоязычной поисковой машины. Данная технология может применяться для создания справочных ресурсов в традиционной форме и для создания электронных энциклопедий представленных в Интернет, на CD и DVD. Именно в рамках проекта региональной электронной энциклопедии существует возможность формирования единого справочного пространства информационных ресурсов, системы региональных авторитетных файлов, созданных на основе справочников-указателей энциклопедии. Среди них: тематический рубрикатор и словник энциклопедии (отрубрицированные наименования статей энциклопедии многосторонне и полно представляют все стороны жизни и истории региона); адресный (географический) указатель, включающий, в том числе, историческую топонимику на электронной карте региона; современная электронная карта региона; картографический указатель (карты и планы, в том числе исторические, отдельных географических объектов региона); именной указатель; предметный указатель (исторические события, организации, учреждения); хронограф (хронологический указатель); библиографический указатель; иконографический указатель.

Эта система пополняемых справочников может стать основой для согласования и интеграции различных информационных ресурсов региона, а электронная энциклопедия – ядром культурных информационных ресурсов, объединяющим базы данных архивов, музеев, библиотек, органов охраны памятников истории и культуры. Базы данных учреждений культуры обогащают контент энциклопедии информацией о хранящихся коллекциях, которые становятся доступными для широких кругов пользователей. Энциклопедия, в свою очередь, дополняет справочной информацией описания объектов культурного наследия из баз данных учреждений культуры. Тексты и изображения электронной энциклопедии и ее информационных спутников, связанные между собой справочниками-указателями представляют, в совокупности, качественно новый информационный ресурс. Поисковые операции на нем порождают новые знания по истории и культуре региона. На наш взгляд, создатели предлагают очень интересный подход к созданию электронного ресурса, который может быть полезен как создателям, так и активным пользователям.

Ориентируясь на региональные информационные потребности, нами создается информационно-поисковая система «Справочные издания о населении и природе Тамбовской области XIX-XX вв.». Данная информационно-поисковая система задумывалась как электронный ресурс с широкими поисковыми возможностями и учебно-методическими указаниями. Впервые предполагается оцифровка незащищенных авторскими правом постоянно востребованных справочных изданий о Тамбовской области (географические словари, административно-территориальные справочники, сборники статистических сведений, обзоры Тамбовской губернии и т.п.) и создание ИПС с дидактическим эффектом. Предполагается перевести в электронный вид соответствующие разделы универсальных, отраслевых и специализированных справочных изданий федеральных издательств. Сканирование и цифровая фотосъемка отобранных изданий производятся в зависимости от формата и условий хранения этих изданий.

Нами реализуется следующий подход к созданию ИПС: разработка концепции системы (подходы к контенту, определение ее информационной емкости, определение алгоритмов поведения пользователей и их соотношение с поисковыми возможностями системы и т.д.), разработка технологических и технических решений. На первом этапе максимально полно выявлялись справочные издания о населении и природе Тамбовской области. Существенными признаками создаваемой степени будет ее многостепенность (включение первичных документов, параллельное включение полного библиографического описания документа и вторично-документальной информации в виде вспомогательных указателей (именного, географического и предметного) и выборочность. Особенность системы и ее дидактическая направленность: раскрывается система изданий, способы ориентации в ней и будет осуществлена связь между справочными изданиями и учебными программами, которые реализуются в учебных заведениях всех уровней в Тамбовской области, где данная информация будет полезна.

Первоначально определялись содержательные параметры поиска, выделялись ключевые слова и словосочетания, определялись географические, хронологические границы поиска соответствующих изданий. ИПС будет ориентироваться на гуманитарные запросы, поэтому природа нами рассматривается как среда обитания, как фактор жизнедеятельности, поэтому информация сугубо естественнонаучного характера включалась выборочно. Источники выявления были дифференцированы на две группы: основные и дополнительные. В качестве основных были обследованы: сводный систематический краеведческий каталог Тамбовской областной универсальной научной библиотеки имени А.С. Пушкина, каталоги и картотеки научной библиотеки Тамбовского государственного университета имени Г.Р. Державина, Государственного архива Тамбовской области, научной библиотеки Тамбовского областного краеведческого музея, каталоги Российской государственной библиотеки, Государственной публичной научно-технической библиотеки, Государственной исторической библиотеки, Российской национальной библиотеки. В качестве дополнительных источников поиска использованы государственные библиографические указатели Российской книжной палаты и библиографические издания Института научной информации по общественным наукам. В результате создана рабочая картотека справочных изданий. Из основных источников выявлено 297 документов, после первичного отбора осталось 257. Из дополнительных – 148. Предполагается отобрать справочные издания для системы по качественным параметрам с использованием и формальных признаков.

Списки электронных копий отдельных справочных изданий будут систематизированы в соответствии с ББК и УДК, что обеспечит их удобный поиск в любых целях: научных, производственных, образовательных, самообразовательных и т.д. Предполагается каждое издание сопроводить аннотацией, предметным, географическим и именным указателями.

Дидактический эффект будет достигаться за счет включения в систему различных вузовских и школьных учебных программ регионального компонента образования (географического, исторического, литературного, библиотечного краеведения, регионоведения, региональной экономики и др.), которые станут составной частью системы и будут связаны с электронными текстами справочников. Предполагается введение специальной информации – оригинальных методических указаний по использованию справочных изданий в учебном процессе, что обеспечит дидактическую направленность ресурса.

«Переходным звеном» от содержательной к технологической составляющей проекта станет построение логической структуры гиперсвязей электронных текстов справочников с аннотациями, указателями, учебными программами, методическими указаниями. Важнейшими элементами технологии реализации проекта являются создание программной «оболочки» и дизайна информационной системы, заполнение информационно-справочной системы, которые могут осуществляться по ходу оцифровки справочников и их библиографического описания.

При создании оболочки мы воспользовались связью программной среды Delphi и базой данных (БД) Paradox. Программная оболочка Delphi является одним из лидеров визуальных систем программирования и сочетает в себе значительный потенциал как для работы с графикой, что немало важно для создания дизайна и обработки оцифрованного справочного материала, так и для работы с базами данных. В качестве БД, как уже говорилось, была выбрана система Paradox, со своей простотой структурирования данных, и что не менее важно распространенностью в Windows-системах. Драйверы БД Paradox включены в стандартную поставку операционных систем Windows 2000 – Windows Vista. Взаимосвязь среды программирования и БД осуществляется посредством мощнейшей в своем роде среды Borland Database Engine (BDE). Программная оболочка в автоматизированном режиме проверяет установку BDE в системе и устанавливает в случае ее отсутствия, а также прописывается алиас БД в случае первичного запуска диска.

БД информационного ресурса состоит из нескольких ключевых таблиц: таблица авторов, таблица ББК, таблица указателей, основной таблицы “main”, где хранится название и идентификационный индекс элемента по которому осуществляется привязка составляющей информации и др. Таблица указателей разбита на категории: географические, предметные, именные, что позволило добавить дополнительные возможности при осуществлении поиска необходимой информации.

Поиск организован по нескольким направлениям: по названию, по ББК, по авторам, по ключевым словам, встречающимся в описании. Увеличить скорость поиска можно выбрав категорию, к которому относится ключ поиска, тем самым уменьшив объем перебираемого контента.

В настоящее время осуществляется оцифровка изданий и создание указателей к ним. Большое количество книг, выбранное для оцифровки, представляет собой музейную реликвию, возраст которых достигает ста и более лет. Каждая страница сохраняется в сжатом формате *.jpg. Данный формат был выбран в связи с распространенностью своего алгоритма сжатия и схемой отображения материала, а также с целью экономии дискового места.

Конкретным итогом работ по проекту станет тиражирование информационной системы на CD для библиотек, архивов, музеев, административных учреждений, учебных заведений области. В целом, мы надеемся, что создание информационно-поисковой системы позволит, во-первых, обеспечить широкий доступ к ценным изданиям ученых, сотрудников библиотек, архивов, музеев, преподавателей, студентов, учащихся учебных заведений и т.д.; во-вторых, сохранить основные экземпляры редких изданий, представляющих собой культурное наследие региона; в-третьих, создать качественный сегмент в региональном информационном пространстве. Приобретенный опыт позволит внести предложения в проекты по оцифровке культурного наследия.