Главное, что объекты в ПрО обладают (могут быть описаны) некоторыми свойствами (параметрами, характеристиками, показателями и т п.)

Вид материалаДокументы

Содержание


Осробенности предметной области, хорошо моделируемой фактографической информацией
Система актуализации БД
Отображение структуры предметной области в структуру БД
Построение концептуальной модели
Поэтому, этому вопросу будет уделено основное внимание в дисциплине ТЭИС, осенью следующего года – курсовая работа.
Сведения о преподавателях кафедры
Учебные поручения кафедры
К вопросу о способах формирования кода.
Отображение состояния объектов предметной области в состояние БД
Контроль уровня данного
Контроль уровня записи
Контроль на уровне групп записей
Меж записный контроль (уровень БД)
Типовые процедуры корректировки БД
Для осуществления замены
Система обработки баз
Средства администрирования БД
Подобный материал:
Вспоминаем обобщенную схему ИС




Предметная

область


Обобщенная схема ИС


Обобщенная схема Фактографической ИС (ФИС)





ПРЕДМЕТ-

НАЯ ОБЛ


Специфика предметной области (ПрО) моделируемой фактографической ИС заключается в следующем.


Объектами такой ПрО могут быть объекты самой различной природы (личности, подразделения, учебные планы, научные исследования, книги, фирмы и др.). Главное, что объекты в ПрО обладают (могут быть описаны) некоторыми свойствами (параметрами, характеристиками, показателями и т.п.). При этом для любого объекта значение одноименного параметра может быть различным, но выбирается из одного множества возможных значений, называемого словарем (классификатором) или является числом.


ОСРОБЕННОСТИ ПРЕДМЕТНОЙ ОБЛАСТИ, ХОРОШО МОДЕЛИРУЕМОЙ ФАКТОГРАФИЧЕСКОЙ ИНФОРМАЦИЕЙ


При информационном моделировании на ЭВМ такая предметная область просто отображается в компьютерные данные следующим образом:


Предметная область Компьютерная модель

  1. Параметр (свойство, хар-ка) 1. Данное

2. Значение параметра 2. Значение данного

3. Перечень возможных значений 3. Классификатор значений параметра для объектов (словарь)

одного типа
  1. Группа параметров, описывающих 4. Схема файла

однотипные объекты с определенной стороны
    1. Описание множества однотипных 4.1. Файл базы

объектов по этой группе параметров данных

4.2 Описание одного объекта по этой 4.2. Одна либо

группе параметров (значения параметров несколько записей

объекта) файла

5. Описание однотипных объектов пред- 5. Система файлов метной области с различных сторон (база данных)
  1. Описание предметной области в целом 6. Система баз данных

(все множество типов объектов)


Средства отображения информационной модели – база данных и система управления данными. Концепцию баз данных, обоснование её появления и успешного использования рассмотрим несколько позже.


Вначале рассмотрим окружение.


Система актуализации БД включает две подсистемы:


 отображения структуры предметной области (ПО) в структуру БД;

 отображения состояния объектов ПО в состояние БД.


Отображение структуры предметной области в структуру БД может трактоваться как проектирование БД.


Процесс проектирования можно представить в виде трех основных этапов:

 формирование концептуальной информационной модели предметной области (КИМПО);

 выбор СУБД;

 отображение КИМПО в логическую и физическую структуру БД выбранной СУБД.


Построение концептуальной модели самый сложный и трудно формализуемый процесс. Отсутствуют конструктивные методики, процесс структуризации по существу является искусством, опирающимся на опыт проектировщика и участие профессионала – работника моделируемой предметной области.

Поэтому, этому вопросу будет уделено основное внимание в дисциплине ТЭИС, осенью следующего года – курсовая работа.


Следует заметить, что если концептуальная модель определена, то процесс проектирования физической структуры БД для всех современных СУБД может быть автоматизирован с помощью средств, имеющихся на рынке программного обеспечения.


Сейчас остановимся лишь на вопросе о целесообразности кодирования значений хранимых данных.


Вопрос о кодировании значений хранимых данных рассматривается, как правило, лишь к данным, возможные значения которых составляют словарь.


Кодирование значений заключается в том, что вместо символьного значения в памяти хранится компактный цифровой код, а процессы перехода от символьного к кодовому (при вводе информации) и от кодового к символьному (при выводе информации конечному пользователю) осуществляется через специальный файл – кодификатор, записи которого, чаще всего, содержат поля с кодированными и не кодированными значениями.


Целесообразность кодирования значений может быть обусловлена следующими причинами:

 экономией компьютерной памяти, занимаемой хранимыми данными;

 сокращением времени внутри машинной обработки кодов меньшего размера, особенно при полном «просмотре» файлов;

 частичной защитой хранимой информации при несанкционированном доступе (при выборе данных не средствами информационной системы невозможно сразу понять смысл значения данного).


Учитывая, что первые две причины обусловлены экономией занимаемой памяти, можно предположить следующие формальные условия целесообразности кодирования значений данных:


 если n  l> n  l + m (l + l) ,

где n – число записей в основном файле, m – число возможных значений данного (число записей в файле-кодификаторе), l- длина не кодированного значения, l - размер кода.


 если на одном и том же домене (словаре) определены несколько данных.


Первое условие говорит о том, что целесообразно кодировать те данные, для которых объем хранения не

кодированных значений больше, чем объем хранения кодированных значений в основном файле плюс объем файла-кодификатора, что и иллюстрируется на рис.



 l  l l l






1 1 1


n n m


Если учесть, что цифровые коды, как правило, не превышают 5 разрядов (даже в символьном представлении можно закодировать 99999 возможных значений), а средний размер значений символьных данных около 30 символов, то

n  6l > n  l + m (l + 6l) 

6n > n + 7m  5n > 7m  n/m >  n/m > 1,4

То есть значения данного целесообразно кодировать даже при однократном использовании кодификатора, если число записей в файле больше числа возможных значений в 1,4 раза, тогда значения такого данного как ПОЛ безусловно целесообразно кодировать, а данного Ф.И.О. – вряд ли.


Второе условие целесообразности кодирования иллюстрируем на следующем примере

СВЕДЕНИЯ О ПРЕПОДАВАТЕЛЯХ КАФЕДРЫ





Шифр кафедры

Ф.И.О. преподавателя

Должность преподавателя

Дата вступления в должность




 25 символов












































УЧЕБНЫЕ ПОРУЧЕНИЯ КАФЕДРЫ





Дисциплина

Вид занятий

Ф.И.О. преподавателя







 25 символов 






























Очевидно, что даже если преподаватель ведет только один вид занятий и по одной дисциплине, целесообразно использовать в файлах личный номер преподавателя размером 4-5 разрядов и файл-кодификатор с полями личный номер преподавателя и Ф.И.О. преподавателя.


К вопросу о способах формирования кода.


Наиболее часто используются 2 способа построения цифровых кодов значений (к не цифровым можно отнести аббревиатуру):

- порядковый, когда возможные значения выстраиваются в требуемом порядке и каждому символьному значению присваивается очередное (по порядку) значение цифрового кода (счетчики в различных программных системах)

- серийно-порядковое, когда для всего множества значений, подлежащих кодированию выделяется некоторое множество значений (относительно не зависимых друг от друга) и они кодируются по порядковым способом – это первый уровень кодирования, затем для каждого значения первого уровня определяется подмножество соответствующих ему значений из оставшегося множества (иерархически зависимых) и они также снабжаются кодами по порядковому способу, но начиная с единицы …….


Примеры

№группы, почтовые индексы


Отображение состояния объектов предметной области в состояние БД осуществляется, как правило, в два этапа:


 фиксации значений параметров объектов предметной области;

 корректировки значений соответствующих данных в БД.


Если в месте возникновения значений параметров установлен компьютер, то эти два этапа могут совпадать, т.е. значения данных вносятся непосредственно в БД, но через заполнение экранной формы документа. В этом случае, как правило, печатается и так называемая «твердая» копия документа, которая визируется ответственными лицами, возможно, ставится печать и бумажный документ хранится в архиве.

Использование бумажных документов даже при компьютерной реализации документооборота объясняется тем, что только личная подпись и печать придают юридический статус документу, а также более высокой надежностью длительного хранения информации на бумажном носителе.


Фиксация значений параметров объектов на бумажных носителях осуществляется в тех случаях, когда в месте возникновения значения нет компьютера.


Разделение процесса актуализации БД на упомянутые два этапа часто осуществляется еще и для защиты от случайных ошибок в процессе первоначального ввода данных.

На этапе корректировки, в начале первичные данные переносятся во временный файл, затем осуществляется контроль значений и их исправление в случае обнаружения ошибок, и лишь после этого осуществляются необходимые изменения в БД.


Значение эффективного контроля вводимых данных трудно переоценить: если в БД хранятся недостоверные данные – теряет смысл вся система хранения и обработки данных.


Существует много способов контроля значений данных, называемых также проверкой ограничений целостности данных.


Контроль уровня данного:


 на соответствие типу данного (не цифра в числовом данном, ограничение на число дней и месяцев в данном типа дата, недопустимый код в логическом данном и т.п.);

 на размер значения данного;

 на обязательность наличия значения ( Not Null);

 на допустимый диапазон, в котором должно быть значение;

 на наличие в словаре ( в списке);

 использование контрольного разряда.


Последний способ используется в России во всех федеральных кодификаторах (их называют классификаторами).


Смысл методики заключается в следующем: цифровой код снабжается (последняя цифра кода) контрольным разрядом, рассчитываемым по специальному алгоритму. Если во введенном коде допущены ошибки в написании цифр кода, то при расчете контрольного разряда по цифрам введенного кода, он вероятнее всего не совпадает с введенным контрольным разрядом.


Контрольный разряд рассчитывается следующим способом. Пусть цифры разрядов кода , не считая контрольного разряда (должен быть на месте a), а - постоянные весовые коэффициенты. Тогда контрольный разряд рассчитывается как остаток от деления на некоторое число, называемое модулем. В России используется деление по модулю 11.

Например, имеем весовые коэффициенты . Тогда числовой код 255 имеет контрольный разряд равный 3 ( 5  3 + 5  7 + 2  4 = 58 остаток от деления на 11 равен 3), т.е. верный код 2553 .

Если при вводе допущено искажение кода, например, 2523, то в результате расчета получаем контрольный разряд равный 5 (2  3 + 5  7 +

+ 2  4 = 49, остаток от деления на 11 равен 5), что не совпадает с введенным контрольным разрядом.


Естественно ошибка (особенно двойная) может быть такой, что контрольный разряд ошибочного кода совпадает с расчетным. Пример надо


Поэтому мы вначале отметили, что при ошибке рассчитанный контрольный разряд «вероятнее всего не совпадает с введенным контрольным разрядом».


Вероятность обнаружения ошибки тем выше, чем выше модуль на который делится сумма произведений разрядов кода на весовые коэффициенты (поэтому в России выбран модуль 11) и чем дальше отстоят друг от друга значения коэффициентов соседних разрядов.


Контроль уровня записи:

 на размер записи;

 на соблюдение арифметико-логических выражений над значениями данных, входящих в запись (типичные примеры – наличие в исходных документах конструкций «всего, в том числе…», «всего, из них…»).


Напоминаем, что запись это совокупность значений определенного множества данных, составляющих описание некоторого объекта предметной области с определенной стороны.



№ группы

Кол. сту-дентов в группе

Число студентов, имеющих по итогам сессии

только 5

только

4 и 5

хотя бы одну 3

1

2

3

4

5











8671

20

5

8

6












2 больше или равно 3+4+5



№ группы

Число студен-тов в группе

Число студентов, имеющих по итогам сессии

только 5

только

4 и 5

хотя бы одну 3

хотя бы одну 2

не завершили

1

2

3

4

5

6

7















8671

20

5

8

6

0

1
















2 = 3+4+5+6+7


Контроль на уровне групп записей:

 контроль по итоговой строке таблицы;

 контроль на обязательность заполнения строк таблицы.


Сведения об итогах сессии по АВТФ

№ группы

Кол. сту-дентов в группе

Число студентов, имеющих по итогам сессии

только 5

только

4 и 5

хотя бы одну 3

1

2

3

4

5











8671

20

5

8

6

8672

21

6

10

5











всего

970

350

240

350

Меж записный контроль (уровень БД):

 арифметико-логические выражения (типичны для контроля множества бухгалтерских документов);

 контроль ссылочной целостности, когда записи одного типа не могут существовать без соответствующих записей другого типа.


Поставщики

Название фирмы



№ счета в банке

Юрид. Адрес













ООО Стек




701000056773


















Покупки

Покупатель

Поставщик

№ платежн. поручения

Название изделия

Сумма

ТГУ













ТПУ

ООО Стек










ТПУ



























ТУСУР

ООО Стек



























Типовые процедуры корректировки БД:

замена значений данных в некоторых записях;

удаление записей;

вставка новых записей.


Для осуществления замены или удаления записи соответствующие записи вначале должны быть найдены (помним, что запись идентифицируется значениями ключевых данных).


При вставке в БД не должно быть записи с тем же значением ключевых данных, что и во вводимой (если таковые обнаружены, то это не достоверные значения, или в БД или во вводимой записи).


Во всех случаях серьезное значение имеет соблюдение ограничений ссылочной целостности. Удаление «старшей» записи может (а в большинстве случаев должно) автоматически привести к удалению всех «подчиненных», замена значений данных ключа записи может быть запрещена или может сопровождаться заменой ссылки на нее от «старшей» и замене соответствующих данных ключей «подчиненных» записей.

Вставка новых записей также может потребовать изменения ссылок в части хранимых записей.





ПРЕДМЕТ-

НАЯ ОБЛ


Система обработки баз может быть представлена состоящей из:

 профессионально-ориентированных средств;

 процедурно-ориентированных программных средств.


Профессионально-ориентированные средства обеспечивают прямую компьютерную поддержку существующих информационных технологий на рабочем месте и максимально учитывают их специфику. Поэтому такие средства часто называют Автоматизированными рабочими местами или АРМами.

Можно определить их и как оригинальные (локальные) средства.


Несомненное достоинство таких систем – создание комфортных условий для работников.

Основной недостаток – необходимость модификации программного обеспечения при изменении информационных технологий, связанных с их совершенствованием или директивными решениями.


Для обеспечения минимальных затрат на модификацию таких систем их необходимо делать открытыми и использовать средства автоматизированного проектирования.


Процедурно-ориентированные средства реализуют типовые процедуры поддержки информационных технологий.

Они являются универсальными средствами типа информационно-справочных систем.


Для работы с базами данных, являющимися информационными моделями очень широкого класса предметных областей, типовыми процедурами являются:


 выбор записей, удовлетворяющих заданным ограничениям на значения данных;

 отбор подмножества данных;

 установление требуемого порядка следования (сортировки) записей;

 определение максимального, минимального, среднего, суммарного значения данного в группе записей; отклонение или доля этих значений – значения соответствующего данного в образующих их записях;

 определение разности, долевого, процентного соотношения данных в одной записи.


Нетрудно заметить, что средства экранного интерфейса современных СУБД, средства интерпретирующие команды SQL, относятся к процедурно-ориентированным.


Несомненным достоинством процедурно -ориентированных средств является их универсальность, независимость от изменений в информационных технологиях на рабочих местах.

Однако, реализовать с их помощью специфические технологии на рабочем месте часто является трудоемкой задачей.

Типовость отмеченных процедур может быть обоснована с учетом особенности систем в сфере экономики, т.е. систем, связанных с производством некоторых конечных продуктов. Это могут быть как материальные объекты (изделия, механизмы, приборы и т. п.) так и некоторые сущности (знания, технологии, проекты, НИРы, услуги и многое другое).


П


О

Т

Р

Е

Б

И

Т

Е

Л

И






  1. Потребность в конечных продуктах
  2. Сводная потребность в конечных продуктах

3. Сводная потребность в материалах (ресурсах)
  1. Договора на поставку материалов (ресурсов)
  2. Поставки материалов (ресурсов)
  3. Передача материалов (ресурсов) в производство
  4. (13) Готовые конечные продукты
  5. Отгрузка конечных продуктов потребления
  6. Организация производства конечных продуктов
  7. Материалы (ресурсы)
  8. Оборудование
  9. Работники



Жизненный цикл производства конечных продуктов предусматривает, в общем случае, выполнение процессов выявления потребности в конечных продуктах, собственно их производства; обеспечение потребности в ресурсах (исходных материалах, полуфабрикатах, сырье, оборудовании, кадрах и т.п.). На всех этапах жизненного цикла в производстве конечных продуктов участвуют люди, используются средства труда (оборудование, помещение и т.п.) и предметы труда, преобразование которых последовательно ведет к созданию конечных продуктов.


Процесс управления на любых этапах жизненного цикла производства конечных продуктов предусматривает выполнение функций планирования (выявления потребностей), учета, анализа и регулирования.


П


О

Т

Р

Е

Б

И

Т

Е

Л

И






1,2,3,4 – планирование производства КП (суммирование, арифметическое выражение пересчета от КП к ресурсам и потребностям в оборудовании и работникам, пропорциональное разбиение по поставщикам)


5,6,7,8 – учет производства КП (суммирование ресурсов по поставщикам, ресурсам и цехам-участкам, суммирование готовых КП в целом и по потребителям)

4-5, 3-6, 2-7, 1-8 анализ результатов производства (сравнение запланированного и фактического)


Регулирование – корректировка плановых заданий




Cфера целесообразного использования:


процедурно-ориентированные средства целесообразно применять для информационной поддержки руководящих работников, которым необходим справочный режим работы с данными, возникающими на самых разных рабочих местах;


профессионально-ориентированные средства наиболее предпочтительны для работников, связанных с обработкой первичной информации, со спецификой в информационной технологии (определенные документы, последовательность действий, определенные участники и т.п.).





ПРЕДМЕТ-

НАЯ ОБЛ


Средства администрирования БД обеспечивают поддержку следующих видов работ администрации БД:

 организация работы с пользователями;

 совершенствование физической организации БД (реорганизация БД);

 обеспечение защиты хранимой информации.


Организация работы с пользователями:

  • Регистрация пользователей;
  • Установление прав доступа;
  • Консультирование пользователей



Совершенствование физической организации БД:

  • Анализ эффективности (производительности) системы обработки данных и БД;
  • Реорганизация (изменение физической структуры) БД;
  • Изменение логической структуры БД .



Обеспечение защиты хранимой информации:
  • Защита от несанкционированного доступа:
  • от «дурака»;
  • от злоумышленника
  • Защита от катастрофического разрушения.