А. В. Брешенков Проектирование баз данных на основе информации табличного вида Допущено в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению подготовки диплом

Вид материала

Содержание

1.4. Задачи объединения и разбиения реляционных таблиц
1.5. Задачи нормализации реляционных таблиц

Подобный материал:

1 2 3 4 5 6 7 8 9 ... 28

1.4. Задачи объединения и разбиения реляционных таблиц

Если удастся преобразовать информацию табличного вида в реляционные таблицы, то это не всегда означает, что их можно непосредственно преобразовывать в формат БД. Может потребоваться объединение нескольких таблиц в одну. Это обусловливается различными причинами.

В частности:

- информация, которую нужно включить в БД, поступает от нескольких контрагентов;

- в существующей БД, в которую вводятся новые данные, используется таблица, объединяющая в себя информацию из нескольких включаемых таблиц.

С другой стороны, может возникнуть обратная проблема, которая связана с преобразованием одной таблицы в несколько таблиц.

Это может произойти:

- когда данные из таблицы, включаемые в существующую БД, в ней уже представлены несколькими таблицами;

- когда таблица в БД не удовлетворяет условиям нормализации [2].

Одним из самых простых случаев является случай, когда несколько одинаковых по сути таблиц необходимо объединить в одну. Решение задачи может свестись к выбору исходной таблицы и добавлению в эту таблицу записей с данными из других таблиц. Однако, если столбцы исходных таблиц не расположены в одинаковой последовательности, то исходные таблицы необходимо предварительно преобразовать к нужному виду. Кроме того, в соответствии с требованиями к таблицам БД их записи должны быть уникальны, т.е. в них должны отличаться значения хотя бы одного поля. Это требование далеко не всегда выполняется, например, когда в исходных таблицах записи отличаются только порядковыми номерами, а эти номера в различных таблицах могут совпадать. В связи с этим может возникнуть необходимость добавления в таблицу специального ключевого поля, значение которого должно быть уникальным для каждой записи.

Более сложным является случай, когда необходимо объединить нескольких дополняющих по данным друг друга таблиц в одну. При этом число и смысловая нагрузка столбцов исходных таблиц может не совпадать. Тогда, кроме проблем объединения, возникают новые проблемы. Для решения задачи объединения такого характера необходимо выявить поля в исходных таблицах, по которым можно провести объединение. Эти поля должны присутствовать во всех таблицах и иметь одинаковую смысловую нагрузку. Такие поля называют ключевыми. После чего необходимо формировать записи целевой таблицы из записей исходных таблиц, при этом критериями формирования новых записей являются одинаковые значения ключевых полей в исходных таблицах. Кроме того, в процессе формирования записи необходимо исключать заголовки и данные одинаковых столбцов.

В случае необходимости разбиения одной таблицы на несколько таблиц, следует руководствоваться критериями эффективности построения новой БД на основе использования исходных таблиц. В частности, необходимо руководствоваться требованиями нормализации таблиц. Если БД уже существует, то необходимо руководствоваться составом таблиц БД, их структурой и связями между таблицами. При разбиении таблиц необходимо иметь в виду, что пользователю БД может потребоваться обработка информации из нескольких таблиц одновременно. Поэтому между результирующими таблицами необходимо обеспечить связи, например, через механизм первичных и внешних ключей.

Для качественного, бездефектного решения задач объединения и разбиения реляционных таблиц необходима разработка формальных моделей исходных и целевых таблиц, формальной методики преобразования таблиц.

1.5. Задачи нормализации реляционных таблиц

После того, как информация приведена к реляционной форме, нет никакой гарантии, что эти таблицы самые удачные с точки зрения их представления и использования в БД. Дело в том, что одни и те же данные могут группироваться в различные отношения (таблицы). Определенный набор отношений обладает лучшими свойствами при манипуляциях с БД, если он отвечает требованиям нормализации отношений. Нормализация отношений - формальный аппарат ограничений на формирование отношений, который позволяет устранить дублирование, обеспечить непротиворечивость хранимых данных, уменьшает затраты на ведение баз данных. Вопросы приведения отношений к нормальным формам широко освещены в литературе по теории построения БД, в частности в [1-6]. Чаще всего выделяют 4-е нормальные формы представления реляционных таблиц. Нет никаких гарантий того, что реляционные таблицы, полученные после этапов преобразования, удовлетворяют этим правилам. Более того, они, скорее всего, нормальным формам не удовлетворяют.

Если данные из реляционных таблиц добавляются к таблицам существующей, нормализованной БД, а структура добавляемых данных совпадает со структурой таблиц БД, то проблема нормализации не стоит, т.к. предполагается, что БД спроектирована, нормализована и изменениям не подлежит.

Если данные из реляционных таблиц добавляются к таблицам существующей, нормализованной БД, а структура добавляемых данных не совпадает со структурой таблиц БД, то возникает проблема нормализации и преобразования структур добавляемых данных.

Если создается новая БД или к существующей БД добавляются новые таблицы, то проблема нормализации актуальна. В связи с этим следующим этапом преобразования информации табличного вида в файлы БД должен быть этап нормализации реляционных таблиц.

Реляционные таблицы находятся в 1-й нормальной форме, если значения в таблице являются атомарными для каждого атрибута таблицы. Другими словами в таблице не должно быть подзаголовков. Этому требованию, если следовать предложенным этапам преобразования информации, реляционные таблицы уже должны удовлетворять.

Реляционные таблицы находятся во 2-й нормальной форме, если никакие неключевые атрибуты не являются функционально зависимыми лишь от части ключа. Таким образом, эта форма может быть нарушена только в том случае, если ключ составной (состоит из нескольких полей). Для выявления нарушений такого рода необходимо проанализировать смысловое значение полей таблицы. Вероятнее всего, это лучше сделать человеку. Однако есть надежда, что этот процесс можно автоматизировать.

Реляционные таблицы соответствуют 3-й нормальной форме, если устранены транзитивные зависимости между атрибутами отношения. Другими словами, неключевые поля таблицы не должны зависеть друг от друга, а должны зависеть только от ключевого поля. Опосредовано выявить нарушение нормализации такого рода можно, если обнаружить часто повторяющиеся поля или группы полей в записях таблицы. В связи с этим процесс приведения к 3-й нормальной форме можно автоматизировать, что и реализовано в некоторых системах управления базами данных, в частности в Microsoft Access. Однако результаты нормализации после использования предлагаемых средств не всегда удовлетворительны, и в этом направлении имеет смысл работать.

Реляционные таблицы соответствуют 4-й нормальной форме, если между реляционными таблицами устранены многозначные зависимости. Между таблицами имеет место многозначная зависимость, если записи одной таблицы связаны с несколькими записями другой и наоборот. Для устранения многозначной зависимости вводится третья таблица, в которой хранятся ключевые поля первых 2-х таблиц. Многозначную зависимость между таблицами можно описать формально. В связи с этим, вероятнее всего, процесс приведения реляционных таблиц к 4-й нормальной форме можно автоматизировать.

Blog

Содержание

1.4. Задачи объединения и разбиения реляционных таблиц

1.5. Задачи нормализации реляционных таблиц