ПРОЕКТИРОВАНИЕ БАЗЫ ДАННЫХ

ВВЕДЕНИЕ

Ключевая роль в достижении успеха большинства компьютеризированных систем принадлежит не используемому оборудованию, а программному обеспечению. Основу информационного обеспечения компьютерных систем составляет совокупность данных. При сложной и совершенной организации информационного обеспечения используется база данных (БД) с расширенной системой управления этими данными, выполняющей функции не только хранения, но и поиска и манипулирования данными.

Одной из самых распространенных сфер применения вычислительной техники является создание различных автоматизированных систем. Среди них САПР, АСУ, АИС, АСНИ, ГИС и другие. Главное различие в этих системах - вид человеческой деятельности, подверженной автоматизации:

· в системах автоматизированного проектирования (САПР)- это проектирование;

· в автоматизированных системах управления (АСУ)- управление (АСУТП - управление технологическими процессами; АСУП - управление производством);

· в автоматизированных информационных системах (АИС) - работа с данными, документами (поиск, хранение и т.д.);

· в автоматизированных системах научных исследований (АСНИ) - научно-экспериментальные исследования;

· в геоинформационных системах (ГИС) – работа с географическими и семантическими (атрибутивными) данными.

В отличие от автоматических систем, в автоматизированных системах часть функций выполняет человек (чаще всего это функции принятия решения).

Каждая из автоматизированных систем согласно ГОСТам включает 5 видов обеспечений:

· техническое;

· программное;

· информационное;

· организационное;

· правовое.

Целью нашего изучения является информационное обеспечение.

 

В состав информационного обеспечения (ИО) могут входить:

· отдельные, несвязанные данные - соответствуют конкретным или действительным фактам. Иногда они описывают идею или неточное действие. В общем случае данные - это сведения об объектах окружающего мира;

· документы - публикации, монографии, служебные документы, отчеты, законодательные акты и т.д. на естественном языке.

· файл - поименованный набор данных во внешней памяти. Работа с файлами осуществляется средствами операционной системы (просмотр, копирование, переименование, удаление, защита, создание и т.д.). Каждая операционная система имеет свою файловую систему;

· базы данных - совокупность взаимосвязанных файлов, данных, документов, описывающих некоторую предметную область;

· система управления и реализации информационно-поисковых процедур.

· предметная область - часть реального мира, рассмотренного в системе, это некоторая совокупность реальных объектов.

Перечисленные компоненты могут входить в информационное обеспечение по отдельности или в некотором сочетании.

База данных является фундаментальным компонентом информационной системы, в общем случае представляет собой поименованную совокупность данных, отображающую состояние объекта или класса объектов, их свойства и взаимоотношения. Жизненный цикл информационной системы неразрывно связан с жизненным циклом системы базы данных, поддерживающей ее функционирование.

Жизненный цикл информационной системы состоит из нескольких этапов.

1. Планирование разработки БД – определение наиболее эффективного способа реализации жизненного цикла системы.

2. Сбор и анализ требованийопределение действий и границ приложения БД, состав ее пользователей и областей применения.

3. Проектированиеконцептуальное, логическое и физическое проектирование БД.

4. Реализация - конструирование информационного образа задачи в памяти компьютера.

5. Тестирование – проверка на соответствие всем требованиям, выдвинутым пользователем.

6. Анализ и преобразование данных – анализ, преобразование и загрузка данных и прикладных программ из старой системы в новую (преобразованную).

Разработку любого приложения базы данных необходимо рассматривать с широкой точки зрения – как разработку определенного компонента всей информационной системы в целом.

Восходящий способ проектирования (проектирование начинается с самого нижнего уровня атрибутов) в наибольшей степени приемлем для разработки простых баз данных с относительно небольшим количеством атрибутов, установить среди которых все существующие функциональные зависимости не представляет особой сложности.

Более подходящей стратегией проектирования сложных БД является использование нисходящего подхода (проектирование сверху - вниз). Проектирование начинается с разработки моделей данных, которые содержат несколько высокоуровневых сущностей и связей, затем проектирование продолжается путем нисходящих уточнений низкоуровневых сущностей, связей и относящихся к ним атрибутов. Нисходящий подход демонстрируется в концепции модели «сущность-связь» - ER-модели (от англ. EREntity-Relationshipmodel), предложенной Ченом.

Изучение семантики данных и упрощение процедур описания требований к данным являются основными этапами моделирования данных.

Модель является некоторой абстракцией представления «реального мира» объектов и событий, а также существующих между ними связей.

Сущности, связи и атрибуты являются фундаментальными информационными объектами любой предметной области.

Моделирование данных упрощает понимание смысла элементов данных. Оптимальная модель данных должна удовлетворять некоторым критериям оптимальности.

Ø Структурная достоверность – соответствие способу определения и организации информации в данной предметной области.

Ø Простота– удобство изучения модели как специалистами в области разработки информационных систем, так и рядовыми пользователями.

Ø Выразительность– способность представлять различия между данными, связи между данными и ограничения, накладываемые на них.

Ø Отсутствие избыточности– исключение излишней информации, представление любой части данных только один раз.

Ø Способность к совместному использованию- отсутствие принадлежности к какому-то одному приложению или технологии и, следовательно, возможность использования модели в различных приложениях и технологиях.

Ø Расширяемость – способность к эволюции и возможность добавления новых требований с минимальными изменениями уже существующих приложений.

Ø Целостность– согласованность со способом использования и управления информацией внутри предметной области.

Ø Схематическое представление– возможность представления модели с помощью наглядных схематических обозначений.

Проектирование БД состоит из трех этапов.

Цель трехуровневого проектирования заключается в отделении пользовательского представления базы данных от ее физического представления.

1. Задача первого – инфологического этапа – этапа концептуального проектирования - состоит в построении семантических моделей данных.

2. Выбор системы управления базой данных (СУБД) и инструментальных средств проектирования БД позволит обеспечить организацию данных в виде некоторых структур, т.е. решить задачу второго - даталогического этапа.

3. Задача следующего - физического этапа – заключается в выборе рациональной структуры хранения данных и методов доступа к ним, исходя из арсенала методов и средств, представляемых разработчику.