Задача глобальной идентификации данных в системе

Вид материалаЗадача
Подобный материал:

УДК 004(06) Информатика и процессы управления


А.М. Самохин 1, М. А. Соколов, в.и. чучкин

Московский инженерно-физический институт (государственный университет),

1 ЗАО «КОНТУР Софт», Москва


МОДЕЛЬ ТИРАЖИРОВАНИЯ ДАННЫХ
В РАСПРЕДЕЛЕННОЙ ИНФОРМАЦИОННОЙ СИСТЕМЕ



Рассматривается проблема тиражирования данных в распределенной информационной системе управления предприятием. Вводится формальная модель, позволяющая описывать и реализовывать тиражирование данных в распределенной информационной системе.


В настоящее время все большую актуальность приобретает задача создания распределенных информационных систем [1]. Если узлы распределенной системы не соединены надежными и скоростными каналами связи, и могут быть не доступны друг другу в какие-то моменты времени, в такой системе невозможно организовать единую распределенную базу данных с поддержкой распределенных запросов и транзакций [2]. В таких системах необходимо использовать асинхронное тиражирование данных между автономными локальными базами данных. Механизмы такого тиражирования реализованы во многих современных реляционных базах данных [1], но использование этих технологий в реляционных БД встречается с рядом принципиальных сложностей. Если тиражирование данных в системе происходит асинхронно по отношению к транзакциям в локальных узлах системы, то возникают следующие задачи, которые невозможно решить, оставаясь в рамках реляционной модели данных:
  • Задача глобальной идентификации данных в системе;
  • Задача разрешения конфликтов при взаимных изменениях данных различными узлами;
  • Задача обеспечения целостности данных в распределенной системе;

Для решения этих задач в Лаборатории Сетевых Технологий ЦНИТ МИФИ и была разработана модель, позволяющая описывать тиражирование данных в распределенной информационной системе, состоящей из множества автономных баз данных.

За основу модели взят ряд предложений, сформулированных в Манифесте систем объектно-ориентированных баз данных [3].

Система тиражирования данных представляется в виде

G (N, T, L, O), где

N – множество узлов системы тиражирования.

T – множество типов объектов тиражирования. Тип объекта тиражирования определяет его структуру, задавая множество именованных атрибутов, которые могут являться ссылками на другие объекты тиражирования.

L – множество связей между узлами системы.

O – множество экземпляров объектов тиражирования.

Экземпляры объектов тиражирования создаются на узлах системы, при этом им присваиваются глобальные уникальные идентификаторы. После создания объект может тиражироваться на другие узлы системы. Правила, по которым объект тиражируется на другие узлы, описаны на каждом узле системы для тех узлов, с которым он связан. Глобальная идентификация данных в системе тиражирования реализуется, так как все тиражируемые данные принадлежат к конкретному экземпляру объекта, однозначно определяемому своим идентификатором и типом. Конфликты изменений возникают при одновременном изменении одного объекта на разных узлах и могут решаться автоматически и с участием пользователя. Целостность данных в системе обеспечивается правильным проектированием структуры объектов тиражирования и правил тиражирования в узлах. Отображение этой модели в базы данных локальных узлов осуществляется при помощи специального программного обеспечения промежуточного уровня. Это программное обеспечение выгружает данные из локальных баз данных, превращая их в объекты тиражирования, и загружает обратно эти объекты в соответствующие базы данных, осуществляет передачу объектов между узлами и работу с уникальными идентификаторами объектов.

Описанная модель тиражирования данных позволяет решать задачи создания различных распределенных информационных систем управления предприятием, а также интеграции в единую информационную систему разнородных существующих программ. На основе данной модели создана и эксплуатируется система тиражирования данных в распределенной системе финансового учета и управления [4].


Список литературы

  1. Барон Г., Ладыженский Г. Технология тиражирования данных в распределенных системах. Открытые системы, №02/1994.
  2. К. Дж. Дейт. Введение в системы баз данных. 7-е издание.: Пер. с англ. – М.: Издательский дом «Вильямс», 2002. – 1072 с.: ил.
  3. М. Аткинсон и др. Манифест систем объектно-ориентированных баз данных. Системы управления базами данных, №04/1995.
  4. Самохин А.М., Соколов М.А., Чучкин В.И. Система репликации данных в распределенной информационной системе. Научная сессия МИФИ-2004. Сб. науч. тр. В 15 т. М.: МИФИ. 2004. Т.10. С. 44-45.




ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 12