Создание веб-интерфейса для построения генеалогических деревьев

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



ран фреймворк Django (см. [7]). Django (Джанго) - свободный фреймворк для веб-приложений на языке Python.

Для хранения данных проекта решено использовать два типа СУБД: реляционную и нереляционную базы данных (см. [8]). Такой выбор основан на необходимости хранения разнородных данных. Реляционная база данных хранит данные, удобно представимые в табличном виде: данные о пользователях, данные о географическом расположении пользователей, о правах доступа, о мультимедийных данных. Для хранения данных о генеалогических деревьях используется документо-ориентированная база данных.

1.4.1 Выбор реляционной базы данных

В качестве реляционных баз данных рассматривались две наиболее популярные реляционные базы данных с открытым исходным кодом: MySQL и PostgreSQL.

Каждая база имеет свои особенности и отличия. Если необходимо быстрое хранилище для простых запросов с минимальной настройкой, лучше выбирать MySQL. Если необходимо надежное хранилище для большого объема данных с возможностью расширения, репликации, полностью соответствующее современным стандартам языка SQL (см. [9]), рекомендуется использовать PostgreSQL.хорошо использовать для простых запросов с отключенными транзакциями, в то время как PostgreSQL может поддерживать более серьезную нагрузку и сложные запросы параллельно с записью в базу данных. Ниша, которую занимает PostgreSQL, более широкая, и потенциал у PostgreSQL выше. Ниша MySQL скромнее, MySQL оправдывает себя как хранилище для некритичных по нагрузке и производительности баз данных.

Основное преимущество PostgreSQL - безопасное и защищённое хранилище данных. В качестве полнофункциональной, свободной реляционной БД (RDBMS), PostgreSQL обладает многими характеристиками, спроектированными для поддержки критически-важных приложений с большим потоком транзакций.

В силу всего вышеперечисленного, в качестве реляционной базы данных решено использовать PostgreSQL (см. [10]).

1.4.2 Выбор нереляционной базы данных

В качестве нереляционной базы данных выбрана база CouchDB (см. [11]).

Основные характеристики этой базы:

-данные сохраняются не в строках и колонках, а в виде JSON-подобных документов, моделью которых является не таблицы, а деревья;

-целостность базы данных обеспечивается исключительно на уровне отдельных записей (но не на уровне связей между ними);

-для построения индексов и выполнения запросов используются функции представления;

-функции-валидаторы, функции-представления, функции-фильтры сохраняются в текстовом виде в самой базе данных;

-каждой базе данных в системе CouchDB соответствует единственное В-дерево; каждое B-дерево хранится в виде отдельного файла на диске;

-поддерживается вертикальная масштабируемость, что означает поддержку как огромных кластеров, так и портативных устройств.

Для манипуляций с данными используется JavaScript - объектно-ориентированный скриптовый язык программирования (см. [12]).

2.Описание базы данных

2.1 Реляционная база данных

Спроектирована реляционная база данных, состоящая из десяти таблиц (см. [13]).

2.1.1 Концептуальная схема базы данных

Концептуальная схема базы данных, отображающая взаимосвязи между таблицами, представлена на рис. 2.1.:

Рис. 2.1. Концептуальная схема базы данных

2.1.2 Описание назначения таблиц

Приведем описание таблиц:

-user - таблица хранит данные о пользователях (табл. 2.1.);

-region - таблица с названиями регионов (пример: Новосибирская область) (табл. 2.2.);

-region_area - таблица с названиями районов региона, пример: Коченевский район (Новосибирская область, Коченевский район) (табл. 2.3.);

-city - таблица с названиями городов/сел/поселков, принадлежащих району региона, пример: с. Прокудское (Новосибирская область, Коченевский район, с. Прокудское) (табл. 2.4.);

-city_area - таблица с названиями районов города, пример: Ленинский (Новосибирск, Ленинский район) (табл. 2.5.);

-media - таблица для хранения информации о мультимедийных данных (табл. 2.6.);

-photo - таблица для связи пользователей и фотографий, на которых они отмечены (табл. 2.7.);

-privilege - таблица для хранения информации о правах пользователей на генеалогические деревья других пользователей (табл. 2.8.);

-album - таблица для хранения информации о альбомах, предназначенных для хранения фотографий (табл. 2.9.);

-media_to_album - таблица для хранения связей между фотографиями и альбомами (табл. 2.10.).

С описанием структур перечисленных выше таблиц можно ознакомиться в Приложении А.

2.2 Нереляционная база данных

2.2.1 Описание структуры документов

Нереляционная база данных будет хранить документы следующего вида:

tree = {

families: [

FAMILY_0,

...,

FAMILY_N,

],

peoples: [

PEOPLE_0,

...,

PEOPLE_N,

],

owner_id: int,

create_date: date,

update_date: date,

revision: string,

},

где для упрощения представления вынесем отдельно описание FAMILY_K и PEOPLE_K:

-FAMILY_K = {"id": int, "hasbent": int, "wife": int, "children": list, "parent_families": list, "child_families": list}

-PEOPLE_K = {"id": int, "lastname": string, "name": string, "patronymic": string, "sex": string, "birthday": date, "deathdate": date, "parent_families": list, "self_families": list}

2.2.2 Описание назначения полей в документе

В документе будет храниться следующая информация о дереве:

-"owner_id": совпадает с id пользователя - создателя дерева;

-"create_date": содержит информацию о дате создания дерева;

-"update_date": содержит информацию о дате последнего изменения дерева;

-"revision": хранит идентификатор текущей ревизии;