Технология хранения, поиска и сортировки информации

СУБД - это совокупность программных и языковых средств, с помощью которых реализуется управление данными в базе, доступ к ним и поддержание их в состоянии адекватном состояниюконкретной предметной области.

Тема 1. Принципы функционирования реляционных баз данных

 

В современных информационно-вычислительных системах (ИВС) одной из центральных является функция хранения, обработки и представления пользователям информации. Примерами таких ИВС являются банковские ИВС, ИВС резервирования билетов, мест в гостиницах. Для хранения информации в ИВС, как правило, используют базу данных [1, 2].

Для управления базами данных, их создания и ведения используются специализированные программные комплексы - системы управления базами данных (СУБД). Их основные функции:

· Создание информационных структур для хранения информации.

· Реализация запросов, удовлетворяющих определенным требованиям.

· Создание отчетов с возможным анализом информации БД.

· Разработка форм, как электронных аналогов бумажных документов.

· Программирование задач пользователя по работе с БД.

· Реализация многопользовательского доступа к БД.

· Защита информации в БД с помощью паролей, шифрации и др.

Для предметной области можно выделить три типа моделей - инфологическая модель предметной области (это ее описание, выполненное без ориентации на используемые в ИВС программные и технические средства), концептуальная модель (это описание объектов, их свойств и их взаимосвязей), логическая модель (это концептуальная модель, преобразованная с учетом используемых в ИВС программных и технических средств) [1, 2].

В организации данных в конкретной ИВС можно выделить два уровня - физический и логический. Физический - это как данные лежат на машинном носителе. Это делается автоматом без вмешательства пользователя. Логический - определяется видом модели данных. Модель данных - это совокупность правил, определяющих допустимые информационные единицы и связи между ними, а также набор операций, допустимых при манипулировании данными. Можно определить три класса моделей -иерархическая, сетевая и реляционная (она доминирует).

Реляционная модель - это совокупность взаимосвязанных двумерных таблиц, обработка данных в которых основывается на теории отношений. Реляционной считается такая БД, в которой все данные представлены для пользователя в виде прямоугольных таблиц значений данных, и все операции над базой данных сводятся к манипуляциям с таблицами. Т.е. она представляет собой совокупность простейших двумерных таблиц - отношений (объектов модели). Таблица состоит из строк и столбцов и имеет имя, уникальное внутри базы данных. Таблица отражает тип объекта реального мира (сущность), а каждая ее строка - конкретный объект. Каждый столбец имеет имя, которое обычно записывается в верхней части таблицы. Оно должно быть уникальным в таблице, однако различные таблицы могут иметь столбцы с одинаковыми именами. Любая таблица должна иметь по крайней мере один столбец; столбцы расположены в таблице в соответствии с порядком следования их имен при ее создании. Строки не имеют имен, порядок их следования в таблице не определен, а количество логически не ограничено. Связи между таблицами устанавливаются динамически по равенству значений соответствующих атрибутов. Используется три типа связей - 1:1, 1:n, n:n.

Понятие базы данных

Каждый человек в жизни многократно сталкивается с «базами данных». Это – многочисленные справочники, энциклопедии и т.п.

Базы данных представляют собой информационные модели, содержащие данные об объектах и их свойствах. Базы данных хранят информацию о группах объектов с одинаковым набором свойств.

Например, база данных «Записная книжка хранит информацию о людях, каждый из которых имеет фамилию, имя, телефон и т.д.; библиотечный каталог хранит информацию о книгах, каждая из которых имеет название, автора, год издания и т.д.

Информация в базах данных хранится в упорядоченном виде. Так, в записной книжке все записи упорядочены по алфавиту, а в библиотечном каталоге – либо по алфавиту (алфавитный каталог), либо по области знания (предметный каталог).

База данных (БД) – это информационная модель, позволяющая упорядоченно хранить данные о группе объектов, обладающих одинаковым набором свойств.

Активное развитие теории баз данных началось в 1970-х гг. Особое место в ней занимает теория реляционных баз данных, разработанная Е.Коддом.

Классификация баз данных

Базы данных классифицируются:

ü по характеру хранимой информации (фактографические, документальные). Фактографические базы данных – это картотеки, а документальные – это архивы. В фактографических БД хранится краткая информация в строго определённом формате. В документальных БД – всевозможные документы;

ü по способу хранения данных (централизованные, распределённые). Вся информация в централизованных БД хранится на одном компьютере. Это может быть автономный ПК или сервер сети, к которому имеют доступ пользователи-клиенты. Распределённые БД используются в локальных и глобальных компьютерных сетях. В таком случае разные части базы данных хранятся на разных компьютерах;

ü по структуре организации данных (реляционные(табличные), иерархические, сетевые),

Иерархические базы данных.Иерархические базы данных графически могут быть представлены как перевернутое дерево, состоящее из объектов различных уровней. Первый (верхний) уровень занимает всегда один объект, второй уровень – объекты второго уровня и т.д.

a
Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении «предка» (объект более высокого уровня) к «потомку» (объект более низкого уровня); при этом «объект-предок» может не иметь «потомков» или иметь их несколько, тогда как «объект-потомок» обязательно имеет только одного «предка». Объекты, имеющие общего «предка», называются близнецами.

 

Иерархической базой данных является структура папок Windows, с которой можно работать, запустив «Проводник». Первый верхний уровень занимает папка «Рабочий стол». На втором уровне находятся папки «Мой компьютер», «Мои документы», «Сетевое окружение» и «Корзина», которые являются потомками папки «Рабочий стол», а между собой являются близнецами. В свою очередь, папка «Мой компьютер» является предком по отношению к папкам третьего уровня, папкам дисков (Диск 3,5 (А:), (С:), (D:) и системным папкам («Принтеры», «Панель управления» и др.).

Сетевые базы данных. Сетевая база данных является обобщением иерархической за счет допущения объектов, имеющих более одного предка, т.е. каждый элемент вышестоящего уровня может быть связан одновременно с любыми элементами следующего уровня. На связи между объектами в сетевых моделях не накладывается никаких ограничений.

б

 

 


Сетевой базой данных фактически является «всемирная паутина» глобальной компьютерной сети Интернет. Гиперссылки связывают между собой сотни миллионов документов в единую сетевую базу данных. Примером сетевой базы данных может служить таблица игр на чемпионате по футболу.

 

ЦСКА Спартак

в

 

Локомотив Динамо

а – иерархическая модель; б – сетевая модель; в – пример сетевой базы данных.

 

Реляционные (табличные) базы данных. В настоящее время предпочтение отдается реляционным базам данных.

Реляционная база данных содержит перечень объектов одного типа, т.е. объектов, имеющих одинаковый набор свойств. Такую базу данных удобно представлять в виде двумерной таблицы: в каждой ее строке последовательно размещаются значения свойств одного из объектов; каждое значение свойства – в своем столбце, озаглавленном именем свойства, например таблица с данными о студентах.

Запись базы данных – это строка таблицы, содержащая набор значений свойств, принадлежащих одному объекту.

Поле базы данных – это столбец таблицы, содержащий значения определенного свойства.