Модели данных

 

Одним из важнейших моментов в процессе проектирования БД является понимание концепций, лежащих в основе моделей данных, используемых как в качестве инструмента проектирования, так и в качестве результата проектирования. В сложившейся терминологии БД и инструменты проектирования, и его результаты рассматриваются как модели. Необходимо различать назначение каждой используемой в процессе проектирования модели данных.

В современной трактовке термин «модель данных» обозначает инструмент моделирования. Модель базы данных (схема данных) или модель предметной области являются результатами моделирования.

Модель данных это интегрированный набор понятий для описания данных, связей между ними и ограничений, накладываемых на данные на предприятии. Для реализации успешного проектирования БД необходимо для каждой модели – инструмента знать три её основных компонента:

— набор правил, определяющих структуру данных;

— определение типов допустимых операций с данными;

— набор ограничений поддержки целостности данных.

Исходя из трехуровневой архитектуры БД, различают три, связанных между собой, вида моделей данных, получаемых в результате проектирования.

1 Внешняя модель данных. Отображает обобщенное представление всех пользователей. Эту модель называют описанием предметной области, формируемым на естественном языке. Представить внешнюю модель можно как в формализованном (схемы, рисунки, таблицы), так и в неформализованном (словесное описание на языке проектировщиков) виде.

2 Концептуальные модели. Концептуальная информационно логическая модель предметной области может быть выражена в виде диаграммы, схемы, рисунка, отображающих обобщенное логическое представление информации предметной области. Концептуальная даталогическая модель данных — в виде рисунка, схемы, отображающих обобщенное логическое представление данных.

3 Внутренняя модель. Является результатом отображения концептуальной модели средствами языка определения данных выбранной СУБД.

В литературе по БД предложено и опубликовано достаточно много различных моделей данных, используемых при проектировании БД как инструментальное средство. Модели, отображающие уровни архитектуры БД, строятся по правилам этих моделей.

Модели данных, как инструменты, делятся на 3 основные категории.

1 Объектные модели данных. В этих моделях используются такие понятия как: классы объектов (типы сущностей), объекты (экземпляры сущностей), свойства классов объектов (атрибуты сущностей), связи между классами объектов. В скобках приведена исторически более ранняя терминология, используемая в теории баз данных.

Среди объектных моделей выделяют наиболее общие типы:

— семантические модели. Их назначение – обеспечение возможности выражения семантики (смысла) предметной области. Это, например, модели типа "сущность—связь" (ER—модели — Entity Relationship model), отображающие семантику предметной области в виде ER—диаграмм;

— функциональные модели, дающие представление о функциях автоматизируемого предприятия, о распределении ответственности за их выполнение. Результаты использования функциональных моделей могут быть представлены в виде диаграмм бизнес—функций, диаграмм потоков данных;

— объектно—ориентированные модели. Эти модели расширяет определение класса объектов (сущности) предметной области с целью включения в определение не только свойств, описывающих состояние объекта, но и действий, которые с ним связаны, т.е. его поведение. Это, например, модели, основанные на использовании языка UML (Unified Modeling Language — унифицированного языка моделирования). Описание предметной области получают в виде различных диаграмм — диаграмм вариантов использования, диаграмм деятельности, диаграмм классов.

В настоящее время для проектирования БД, получения концептуальной инфологической модели предметной области широко используются семантические модели «сущность—связь».

2 Модели на основе физических записей. Такие модели позволяют описывать логическую структуру БД в виде записей фиксированного формата. Каждый тип записи определяет фиксированное количество полей, поля имеют фиксированную длину. Существует три основных типа логических моделей данных на основе записей:

— иерархическая (hierarchical data model);

— сетевая (network data model);

— реляционная (relational data model).

3 Физические модели данных. Модель содержит всю информацию, необходимую для реализации конкретной БД в среде выбранной (целевой) СУБД. В физической модели в виде описания содержится информация обо всех объектах БД. В описании объектов БД определяется физический формат данных, реализуются ограничения предметной области, бизнес—логика автоматизируемого предприятия, уровни доступа пользователей. Описание создается на языке определения данных (ЯОД) выбранной (целевой) СУБД. В состав ЯОД входят операторы, позволяющие создать или удалить объект БД, модифицировать его структуру. Физическая модель данных не затрагивает вопросы физического размещения данных на машинных носителях, в настоящее время это максимально реализуется средствами СУБД.

Модели первых двух групп используются для формирования концептуального уровня архитектуры БД, третьей – для описания БД на внутреннем уровне.

Модель данных, полученная в результате проектирования, должна представлять автоматизируемое предприятие в таком виде, который позволит проектировщикам и пользователям БД обмениваться конкретными недвусмысленными мнениями. Оптимальная модель данных, полученная в результате проектирования, должна удовлетворять следующим критериям:

— обладать структурной достоверностью – способы определения информации в модели данных должны соответствовать организации информации на рассматриваемом предприятии;

— быть относительно простотой, легко понимаемой, как профессионалами в области разработки БД, так и обычными пользователями;

— обладать выразительностью — представлять отличия между разными типами данных, связями и ограничениями;

— обладать отсутствием избыточности, любая часть данных должна быть представлена только один раз;

— обладать возможностью совместного использования, не принадлежать к какому—то особому приложению или технологии;

— быть целостной, согласованной со способами использования и управления информацией внутри предприятия;

— обладать расширяемостью, эволюционировать с целью включения новых требований с минимальным влиянием на уже существующих пользователей;

— иметь возможность представления в виде диаграмм.

Использование моделей данных на этапах проектировании БД представлено в таблице 1.

Таблица 1 — Модели данных, используемые при проектировании БД

Уровень архитектуры БД Модель данных, как инструмент, используемый для формирования схемы БД Результат проектирования
Внешний уровень Функциональные модели, модели на основе языка UML. Диаграмма иерархии функций, диаграмма потоков данных и др.
Концептуальный уровень 1. Семантические модели («сущность—связь»)   2. Модели на основе физических записей 1. ER—диаграмма предметной области – концептуальная информационно—логическая (инфологическая) модель (ИЛМ) предметной области 2. Логическая структура БД – концептуальная даталогическая модель (ДЛМ) БД.
Внутренний уровень ЯОД СУБД 1. Техническое описание объектов БД. 2. SQL—скрипты объектов БД.