Фактографические информационные системы

Базовые типы информационных систем

 

К наиболее распространенным и перспек­тивным типам информационных систем относятся:

· фактографические;

· гипертекстовые;

· документальные;

· интеллектуальные.

 

 

Основные признаки – простая структура данных и сложная сис­тема взаимосвязей между элементами данных.

В фактографических системах модель предмет­ной области заключена в структуре базы данных (БД), и потому основное внима­ние сосредоточивается на проблеме проектирования БД.

В исторической последовательности развития данных систем сначала появились информационные системы, базирующиеся на иерархических, затем на сетевых и, наконец, на реляционных представле­ниях о структуре предметной области.

В настоящее время наиболее распространенным подходом является реляционный (табличные БД), что не исключает, конечно, включения элементов иерархиче­ских и сетевых представлений при проектировании ИС.

Таким образом, фактографические ИС – это ИС основанные на технологии баз данных.

База данных (БД) – совокупность взаимосвя­занных данных, собранная в одном или нескольких файлах и организованная соответствующим образом, характеризующаяся возможностью использова­ния для большого количества приложений, возможностью быст­рого получения и модификации необходимой информации, ми­нимальной избыточностью информации и независимостью от прикладных программ.

Основное свойство баз данных — независимость данных и использующих их программ. Независимость данных подразумевает, что изменение дан­ных не приводит к изменению прикладных программ и наоборот.

Специализированные программные средства для работы с базами данных называются системами управления базами данных (СУБД).

Модели баз данных базируются на подходе к об­работке информации, состоящем в том, что структуры данных об­ладают относительной устойчивостью.

Действительно, типы объек­тов, для управления которым создается информаци­онная технология, если и изменяются во времени, то достаточно редко, а это приводит к тому, что структура данных для этих объек­тов достаточно стабильна.

В результате возможно построение ин­формационной базы с постоянной структурой и изменяемыми значениями данных.

Например: база данных студентов вуза по структуре содержит поля ФИО студента, дата рождения, место проживания и т.п. и не зависит от конкретных студентов, т.е. студенты могут зачисляться и отчисляться, а структура данных неизменна.

Для пояснения логической структуры основных моделей баз данных рассмотрим такую простую задачу: необходимо разра­ботать логическую структуру БД для хранения данных о трех поставщиках: П1, П2 и П3, которые могут поставлять товары Т1, Т2 и Т3 в следующих комбинациях: поставщик П1 — все три вида товаров, поставщик П2 — товары T1 и Т3, поставщик П3 — това­ры Т2 и Т3. Нужно хранить информацию о поставщиках, характеристиках товаров и их количестве.

Иерархическая модель представляется в виде древовидного графа, в котором объекты выделяются по уровням соподчинен­ности (иерархии) объектов (рисунок 3.1).

 

 

 

Рисунок 3.1 - Иерархическая модель БД

 

На верхнем, первом уровне находится информация об объекте "поставщики" (П), на втором - о конкретных поставщиках П1, П2 и П3, на нижнем, третьем, уровне – о товарах, которые могут поставлять конкретные поставщики.

В иерархической модели дол­жно соблюдаться правило: каждый порожденный узел не может иметь больше одного порождающего узла (только одна входящая стрелка); в структуре может быть только один непорожденный узел (без входящей стрелки) - корень.

Узлы, не имеющие входных стре­лок, носят название листьев. Узел интегрируется как запись. Для поиска необходимой записи нужно двигаться от корня к листьям, т.е. сверху вниз, что значительно упрощает доступ.

Достоинство иерархической модели данных заключается в том, что она позволяет описать их структуру, как на логическом, так и на физическом уровне.

Недостатками данной модели являются жесткая фиксированность взаимосвязей между элемен­тами данных, вследствие чего любые изменения связей требуют изменения структуры, а также жесткая зависимость физической и логической организации данных.

Быстрота доступа в иерархи­ческой модели достигнута за счет потери информационной гиб­кости. Указанные недостатки ограничивают применение иерархической структуры.

Сетевая модель базы данных для поставленной задачи пред­ставлена в виде диаграммы связей (рисунок 3.2).

 

 

 

Рисунок 3.2 - Сетевая модель БД

 

На диаграмме указа­ны независимые (основные) типы данных П1, П2 и Пз, т.е. информация о поставщиках, и зависимые - информация о товарах Т1, Т2 и Тз. В сетевой модели допустимы любые виды связей меж­ду записями и отсутствует ограничение на число обратных свя­зей. Но должно соблюдаться одно правило: связь включает ос­новную и зависимую записи.

Достоинство сетевой модели БД - большая информаци­онная гибкость по сравнению с иерархической моделью. Однако сохраняется общий для обеих моделей недостаток - доста­точно жесткая структура, что препятствует развитию информа­ционной базы системы управления.

Наибольшей гибкостью и как следствие наибольшее распространение имеет реляционная модель данных.

В реляционной модели базы данных взаимосвязи между элемен­тами данных представляются в виде двумерных таблиц, называе­мых отношениями.

Записи - горизонтальные строки данных в таблицах.

Поля - вертикальные столбцы данных в таблицах. Каждое поле представляет собой элемент, зарезервированный для данных определенного типа.

В таблице должен быть столбец, значения, в которых изначально должны быть раз­личными для разных строк этой таблицы, то есть столбцы, своими значениями определяющие, или идентифицирующие, строку.

Такие столбцы (или столбец) образуют первичный ключ таблицы (primary key) и называются ключевыми. Ино­гда в таблице встречаются столбцы, которые не являются ее ключом, но пред­ставляют первичный ключ другой таблицы. Такие столбцы называются внешним ключом (foreign key). Именно с помощью первичных и внешних ключей образу­ются и поддерживаются связи между таблицами в реляционной базе данных.

Преимуществами реляционной модели БД являются про­стота логической модели (таблицы привычны для представления информации); гибкость системы защиты (для каждого отноше­ния может быть задана правомерность доступа); независимость данных; возможность построения простого языка манипулиро­вания данными с помощью математически строгой теории реля­ционной алгебры (алгебры отношений).

Собственно, наличие строгого математического аппарата для реляционной модели баз данных и обусловило ее наибольшее распространение и перспек­тивность в современных информационных технологиях.

Для приведенной выше задачи о поставщиках и товарах логи­ческая структура реляционной БД будет содержать три таблицы (отношения): R1, R2, R3, состоящие соответственно из записей о поставщиках, о товарах и о поставках товаров поставщиками (рисунок 3.3).

 

 

 

Рисунок 3.3 - Реляционная модель БД

 

Если детализировать записи, то получим структуру БД, изображенную на рис. 4. Каждый поставщик име­ет номер, уникальный для этого поставщика, фамилию (естествен­но неуникальную), значение рейтинга и местонахождение. Каждый товар имеет уникальный номер, название, вес и цвет.

В таблице R3 отражена поставка товаров. Она служит для того, чтобы связать между собой две другие таблицы.

 

 

 

Рисунок 3.4 - Пример таблиц

 

Целостность данных означает систему правил, используемых в СУБД для поддержания связей между записями в связанных таблицах при изменении данных в таблицах, а также обеспечивающих защиту от случайного удаления или изменения связанных данных.