ПРОЕКТИРОВАНИЕ БАЗЫ ДАННЫХ
ВВЕДЕНИЕ
Ключевая роль в достижении успеха большинства компьютеризированных систем принадлежит не используемому оборудованию, а программному обеспечению. Основу информационного обеспечения компьютерных систем составляет совокупность данных. При сложной и совершенной организации информационного обеспечения используется база данных (БД) с расширенной системой управления этими данными, выполняющей функции не только хранения, но и поиска и манипулирования данными.
Одной из самых распространенных сфер применения вычислительной техники является создание различных автоматизированных систем. Среди них САПР, АСУ, АИС, АСНИ, ГИС и другие. Главное различие в этих системах - вид человеческой деятельности, подверженной автоматизации:
· в системах автоматизированного проектирования (САПР)- это проектирование;
· в автоматизированных системах управления (АСУ)- управление (АСУТП - управление технологическими процессами; АСУП - управление производством);
· в автоматизированных информационных системах (АИС) - работа с данными, документами (поиск, хранение и т.д.);
· в автоматизированных системах научных исследований (АСНИ) - научно-экспериментальные исследования;
· в геоинформационных системах (ГИС) – работа с географическими и семантическими (атрибутивными) данными.
В отличие от автоматических систем, в автоматизированных системах часть функций выполняет человек (чаще всего это функции принятия решения).
Каждая из автоматизированных систем согласно ГОСТам включает 5 видов обеспечений:
· техническое;
· программное;
· информационное;
· организационное;
· правовое.
Целью нашего изучения является информационное обеспечение.
В состав информационного обеспечения (ИО) могут входить:
· отдельные, несвязанные данные - соответствуют конкретным или действительным фактам. Иногда они описывают идею или неточное действие. В общем случае данные - это сведения об объектах окружающего мира;
· документы - публикации, монографии, служебные документы, отчеты, законодательные акты и т.д. на естественном языке.
· файл - поименованный набор данных во внешней памяти. Работа с файлами осуществляется средствами операционной системы (просмотр, копирование, переименование, удаление, защита, создание и т.д.). Каждая операционная система имеет свою файловую систему;
· базы данных - совокупность взаимосвязанных файлов, данных, документов, описывающих некоторую предметную область;
· система управления и реализации информационно-поисковых процедур.
· предметная область - часть реального мира, рассмотренного в системе, это некоторая совокупность реальных объектов.
Перечисленные компоненты могут входить в информационное обеспечение по отдельности или в некотором сочетании.
База данных является фундаментальным компонентом информационной системы, в общем случае представляет собой поименованную совокупность данных, отображающую состояние объекта или класса объектов, их свойства и взаимоотношения. Жизненный цикл информационной системы неразрывно связан с жизненным циклом системы базы данных, поддерживающей ее функционирование.
Жизненный цикл информационной системы состоит из нескольких этапов.
1. Планирование разработки БД – определение наиболее эффективного способа реализации жизненного цикла системы.
2. Сбор и анализ требований – определение действий и границ приложения БД, состав ее пользователей и областей применения.
3. Проектирование – концептуальное, логическое и физическое проектирование БД.
4. Реализация - конструирование информационного образа задачи в памяти компьютера.
5. Тестирование – проверка на соответствие всем требованиям, выдвинутым пользователем.
6. Анализ и преобразование данных – анализ, преобразование и загрузка данных и прикладных программ из старой системы в новую (преобразованную).
Разработку любого приложения базы данных необходимо рассматривать с широкой точки зрения – как разработку определенного компонента всей информационной системы в целом.
Восходящий способ проектирования (проектирование начинается с самого нижнего уровня атрибутов) в наибольшей степени приемлем для разработки простых баз данных с относительно небольшим количеством атрибутов, установить среди которых все существующие функциональные зависимости не представляет особой сложности.
Более подходящей стратегией проектирования сложных БД является использование нисходящего подхода (проектирование сверху - вниз). Проектирование начинается с разработки моделей данных, которые содержат несколько высокоуровневых сущностей и связей, затем проектирование продолжается путем нисходящих уточнений низкоуровневых сущностей, связей и относящихся к ним атрибутов. Нисходящий подход демонстрируется в концепции модели «сущность-связь» - ER-модели (от англ. ER – Entity-Relationshipmodel), предложенной Ченом.
Изучение семантики данных и упрощение процедур описания требований к данным являются основными этапами моделирования данных.
Модель является некоторой абстракцией представления «реального мира» объектов и событий, а также существующих между ними связей.
Сущности, связи и атрибуты являются фундаментальными информационными объектами любой предметной области.
Моделирование данных упрощает понимание смысла элементов данных. Оптимальная модель данных должна удовлетворять некоторым критериям оптимальности.
Ø Структурная достоверность – соответствие способу определения и организации информации в данной предметной области.
Ø Простота– удобство изучения модели как специалистами в области разработки информационных систем, так и рядовыми пользователями.
Ø Выразительность– способность представлять различия между данными, связи между данными и ограничения, накладываемые на них.
Ø Отсутствие избыточности– исключение излишней информации, представление любой части данных только один раз.
Ø Способность к совместному использованию- отсутствие принадлежности к какому-то одному приложению или технологии и, следовательно, возможность использования модели в различных приложениях и технологиях.
Ø Расширяемость – способность к эволюции и возможность добавления новых требований с минимальными изменениями уже существующих приложений.
Ø Целостность– согласованность со способом использования и управления информацией внутри предметной области.
Ø Схематическое представление– возможность представления модели с помощью наглядных схематических обозначений.
Проектирование БД состоит из трех этапов.
Цель трехуровневого проектирования заключается в отделении пользовательского представления базы данных от ее физического представления.
1. Задача первого – инфологического этапа – этапа концептуального проектирования - состоит в построении семантических моделей данных.
2. Выбор системы управления базой данных (СУБД) и инструментальных средств проектирования БД позволит обеспечить организацию данных в виде некоторых структур, т.е. решить задачу второго - даталогического этапа.
3. Задача следующего - физического этапа – заключается в выборе рациональной структуры хранения данных и методов доступа к ним, исходя из арсенала методов и средств, представляемых разработчику.