Информационный анализ предметной области

Лекция 11. Разработка базы данных. Информационный анализ предметной области и определение логической структуры БД

Разработка базы данных производится на основе обследования предметной области (ПО) и является результатом информационного анализа и построения модели данных предметной области. Завершается разработка определением логической структуры БД.

На основе обследования составляется описание ПО и документов, которое должно охватывать весь спектр реальных объектов, процессов и явлений, т.е. сущностей, данные о которых должны быть размещены в БД. Обследование начинается с определения состава данных ПО, подлежащих хранению в базе для обеспечения задач и запросов пользователей. Основным источником данных являются справочные, плановые и оперативно-учетные документы. Таким образом, определению структуры базы данных предшествует выявление информационных потребностей.

Далее необходимо осуществить информационный анализ с целью формализации данных, необходимой для их организации и обработки во внутримашинной сфере. При этом должен быть произведен семантический анализ данных и выявлены логические взаимосвязи. В результате данные должны быть структурированы. Удобным способом представления структурированных данных является информационно-логическая модель данных предметной области (ИЛМ ПО). Такая модель является основой для определения логической структуры БД в соответствии с типом модели данных, поддерживаемой СУБД.

Для получения проекта структуры реляционной БД в процессе построения ИЛМ должна быть произведена нормализация данных предметной области, которая позволит получить каноническую форму ИЛМ. Разработка ИЛМ ПО базируется на описании данных и документов предметной области, полученном в результате ее обследования. В процессе информационного анализа для построения канонической ИЛМ необходимо определить структуру и связи нормализованных информационных объектов. На основе канонической ИЛМ, легко получить логическую структуру реляционной БД. Такая БД будет отвечать требованиям, отсутствия избыточности (дублирования описательных данных), однократного ввода и в ней может поддерживаться целостность (непротиворечивость) данных.

В результате проектирования должна быть определена структура реляционной базы, т.е. состав реляционных таблиц, их структура и логические связи таблиц. Структурареляционной таблицы определяется составом столбцов (полей), их последовательностью, типом и длиной (размером) данных каждого столбца, а также ключом таблицы(уникальный идентификатор записей).

Варианты подходов к проектированию БД. При проектировании базы данных могут использоваться два подхода. При первом подходе сначала устанавливаются основные задачи, для решения которых строится база, и потребности задач в данных. Строго в соответствии с потребностями выявляются информационные объекты, из которых должна состоять БД. При втором подходе изучается предметная область, производится анализ её данных, и устанавливаются типовые объекты предметной области. Возможно сочетание обоих подходов.

При разработке ИЛМ в соответствии с первым подходом сначала осуществляется выявление форм документов – источников, содержащих необходимых данные. Данные в документах представлены в виде реквизитов. Далее могут быть установлены функциональные зависимости реквизитов, которые используются для выделения нормализованных информационных объектов. Последующее определение структурных связей между объектами позволяет закончить построение информационно-логической модели (ИЛМ). Информационно-логическая модель должна быть представлена в каноническом виде, где между связанными нормализованными объектами отображены только иерархические отношения (типа 1:M) и объекты распределены по уровням иерархии.

Определение логической структуры реляционной базы данных на основе канонической ИЛМ является в значительной степени формальным, так как отображается в структуру реляционной БД адекватно. Информационные объекты отображаются в реляционные таблицы с соответствующей структурой. Логические связи объектов отображаются связями таблиц с помощью соответствующих ключей связи.