Реляционная модель.
Модели баз данных.
Абстрактное представление базы данных называется моделью базы данных. Модель базы данных определяет структуру данных и операции их обработки. Поиски наилучшей модели базы данных все еще ведутся. Цель этих поисков найти модели, позволяющие легко реализовать сложные информационные системы, компактно записывать запросы информации и создавать эффективные системы управления базами данных.
В настоящее время СУБД основываются на использовании иерархической, сетевой или реляционной модели, или на комбинации этих моделей.
В этой модели концептуальное представление базы – набор таблиц, состоящих из строк и столбцов. СУБД в таком случае будет включать процедуры, которые позволят приложению выбирать определенные элементы определенной строки таблицы.
В настоящее время эта модель является наиболее распространенной (рис. 3.16, 3.17). Данные в такой базе хранятся в прямоугольных таблицах (называемых отношениями). Строки в таблице называются записями, столбцы – атрибутами (полями). Каждая запись столбца описывает некоторую характеристику, или атрибут, сущности, представляемой соответствующей строкой. Значения атрибутов определяются из доменов. Домен – область определения значений одного или нескольких атрибутов.
Поле - элементарная единица логической организации данных, которая соответствует неделимой единице информации - реквизиту. Для описания поля используются следующие характеристики:
1) имя поля (например, Фамилия, Имя, Отчество, Дата рождения);
2) тип данных, которые будут находиться в этом поле (например, символьный, числовой, календарный);
3) длина (например, 15 байт, причём длина поля будет определяться максимально возможным количеством символов);
4) точность для числовых данных (например, два десятичных знака для отображения дробной части числа).
Запись - совокупность логически связанных полей. Экземпляр записи - отдельная реализация записи, содержащая конкретные значения её полей.
Файл (таблица) - совокупность экземпляров записей одной структуры. Описание логической структуры записи файла содержит последовательность расположения полей записи и их основные характеристики. В структуре записи файла указываются поля, значения которых являются:
• первичными ключами, которые идентифицируют экземпляр записи;
• вторичными ключами, которые играют роль поисковых или группировочных признаков (по значению вторичного ключа можно найти несколько записей).
Рис. 3.16. Структура таблицы реляционной базы данных.
Каждая реляционная таблицапредставляет собой двумерный массив и обладает следующими свойствами:
1) каждый элемент таблицы - один элемент данных;
2) все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т.д.) и длину;
3) каждый столбец имеет уникальное имя;
4) одинаковые строки в таблице отсутствуют;
5) порядок следования строк и столбцов может быть произвольным.
Поле, каждое значение которого однозначно определяет соответствующую запись, называется простым ключом (ключевым полем, первичным ключом). Если записи однозначно определяются значениями нескольких полей, то такая таблица базы данных имеет составной ключ.
Нормализация таблиц представляет собой способы разделения одной таблицы базы данных на несколько таблиц, объединенных связями. Таблица находится в первой нормальной форме, когда ни одно из полей не содержит более одного значения и ключевое поле не пусто. Эта форма является основой реляционной модели данных. В такой таблице нет полей, которые можно было бы разделить на несколько. Таблица находится во второй нормальной форме, если она удовлетворяет требованиям первой нормальной формы и все ее поля, не входящие в первичный ключ, связаны полной функциональной зависимостью с первичным ключом (каждому значению ключевого поля соответствует одно значение поля таблицы). Если таблица имеет простой первичный ключ, то она автоматически находится во второй нормальной форме. Таблица находится в третьей нормальной форме, если она удовлетворяет определению второй нормальной формы и ни одно из ее не ключевых полей не зависит функционально от любого другого не ключевого поля. Требование третьей нормальной формы сводится к тому, чтобы все не ключевые поля зависели только от первичного ключа и не зависели друг от друга. Процесс нормализации позволяет разработать базу данных, требующую наименьших ресурсов памяти.
Первичная разработка реляционной базы данных включает в себя создание таблиц, составляющих базу данных. Как показывает практика удобно разбивать большие таблицы на несколько небольших, если это можно сделать без потери информации. Над таблицами можно производить следующие операции: 1) выбрать строку, 2) выбрать столбец; 3) объединить несколько таблиц в одну. [4, 5]
В действительности данные базы хранятся на запоминающем устройстве. Чтобы освободить разработчика базы данных от подробностей фактической реализации хранения, предусмотрена СУБД, которая позволяет писать приложения в терминах модели базы данных. В обязанности СУБД входит получение команд в терминах реляционной модели и преобразование их в действия, проводимые в действительной структуре хранения. Это делается за счет предоставления набора процедур, которые приложение может использовать как абстрактные инструменты.
Простейший способ, при помощи которого СУБД может реализовать таблицу – записать ее в виде последовательного файла, в котором каждая строка является логической записью. Но такая организация данных при выполнении операции поиска потребует последовательного поиска в файле, а этот процесс занимает много времени, если таблица большая. Поэтому СУБД, вероятно, будет хранить таблицу как индексированный файл или применять методы хеширования для обеспечения быстрого доступа к данным.
Рис. 3.17. Принцип организации связей между разными отношениями (таблицами) в реляционной модели