Введение. Понятие баз данных. Виды баз данных. Средства реализации баз данных. Основные этапы создания баз данных
Одной из самых распространенных сфер применения вычислительной техники является создание различных автоматизированных систем. Среди них САПР (системы автоматизированного проектирования), АСУ (автоматизированные системы управления), АИС (автоматизированные информационные системы), АСНИ (автоматизированные системы научных исследований) и другие. Главное отличие этих системах - вид автоматизируемой человеческой деятельности. В САПР осуществляется автоматизация проектирования, в АСУ - управления (причем системы автоматизированного управления технологическими процессами называются АСУ ТП, управления производством - АСУП), в АИС – хранения и поиска данных, в АСНИ - научно-экспериментальных исследований. В отличие от автоматических систем, в автоматизированных системах часть функций выполняет человек и чаще всего это функции принятия решения.
Каждая из автоматизированных систем согласно государственным стандартам включает несколько основных видов обеспечений, в том числе техническое обеспечение, программное, информационное,организационное и правовое. Целью рассмотрения данного пособия является информационное обеспечение автоматизированных систем. Информационное обеспечение может быть организовано различным способом и включать данные хранящиеся в оперативной и (или) внешней памяти. Использование баз данных в настоящее время являются основным способом организации информационного обеспечения автоматизированных систем в случае необходимости долговременного хранения данных. В переводе с латинского языка данное (datum) - это факт. Тем не менее, данные не всегда соответствуют конкретным, реально существующим фактам. Иногда они описывают идею или неточное действие, поэтому в общем случае данные - это сведения об объектах окружающего мира. В случае необходимости долговременного хранения данных, то есть использования не только оперативной, но и внешней памяти используется понятие файла. Файл – это поименованный набор данных во внешней памяти. Работа с файлами осуществляется средствами операционной системы (просмотр, копирование, переименование, удаление, защита, создание и другие операции). Каждая операционная система поддерживает определенную файловую систему.
Не смотря на большое разнообразие определений понятия баз данных, все эти определения имеют три основные характеристики – долговременное хранение данных, данные имеют определенную структуру, данные логически взаимосвязаны и относятся к определенной предметной области. Таким образом, База данных – это совокупность взаимосвязанных данных, хранящихся во внешней памяти, описывающих некоторую предметную область. Предметная область – это часть реального мира, рассматриваемого в автоматизированной системе.
В зависимости от способа хранения данных различают следующие виды баз данных:
1. Локальная база данных (централизованная)- база данных, хранящая данные в памяти одной вычислительной машины.
2. Распределенная база данных – база данных, хранящая данные, в памяти различных ЭВМ вычислительной сети.
В зависимости от вида хранимойинформации различают следующие виды баз данных:
1. Фактографические базы данных – базы данных, хранящие информацию в виде данных, отражающих фактические значения, или иначе текущее состояние предметной области.
2. Динамические базы данных - базы данных, хранящие данные и время их внесения или изменения, отображая состояние предметной области в определенный момент времени.
3. Документальные базы данных – базы данных, хранящие информацию в виде документов, то есть в виде определенным образом организованной информации, включая отчеты, монографии и других видов документов.
4. Графические базы данных – базы данных, хранящие информацию в виде графических объектов, например видеоданные, “puctoral date base”, “graphics based data base” и другие.
5. Интегрированные базы данных – базы данных, хранящие информацию в виде данных, документов, графических объектов в любой комбинации.
В зависимости от структуры хранимых данных илиот модели логического уровня представления данныхразличают следующие виды баз данных: иерархические, сетевые, реляционные и другие виды. Более подробно особенности этих баз данных будут рассмотрены в первой главе пособия.
Важным вопросом при работе с базами данных является вопрос выбора средства реализации баз данных. Можно выделить следующие виды основных средств реализации баз данных:
1. Разработчик базы данных, используя возможности файловой системы, создает на языке высокого уровня собственный сервис пользователя, позволяющий работать с файлами и реализующий определенные методы доступа к данным. Такие средства обычно более экономичны с точки зрения необходимой памяти на реализацию систем баз данных, но требуют больших затрат на разработку и теряют свои преимущества по сравнению с другими средствами реализации баз данных в универсальности.
2. Система управления базами данных (СУБД) – средство реализации баз данных, выполняющее все функции файловой системы, функции создания и ведения базы данных как совокупности взаимосвязанных файлов, функции манипулирования данными. К функциям файловых систем относятся возможности создания, удаления, переименования, изменения структуры файлов баз данных. К функции ведения данных относятся операции добавления, удаления, изменения, просмотра данных. К функции манипулирования данными относятся операции сортировки данных, поиска, выборки, фильтрации данных.
3. Машины баз данных – программно-аппаратные средства реализации баз данных. Машины баз данных не стали таким же массовым инструментом разработчика автоматизированных информационных систем, как СУБД. Это связано с тем, что машины баз данных, имея преимущество в быстродействии выполнения многих функций баз данных, по сравнению с СУБД, так как многие функции реализуются аппаратно, тем не менее, проигрывают в универсальности применения обычных персональных компьютеров. Машина баз данных позволяют преодолеть те ограничения производительности СУБД, которые вызваны сложностью их архитектуры и выполняемых ими функций управления данными. Решение этой проблемы особенно актуально для создания систем распределенной обработки данных. Новое оборудование повышает уровень надежности систем баз данных, позволяет разгрузить универсальные ЭВМ и, за счет этого, обеспечить более эффективное функционирование прикладных систем. В дальнейшем предполагается использование машин баз данных не только в качестве периферийного оборудования, но и в качестве самостоятельных процессоров – узлов сети ЭВМ. Использование машин баз данных будет способствовать прогрессу распределенных баз данных и систем баз знаний, а также прогрессу в работе с базами данных больших объемов. Следует отметить, что в настоящее время наиболее распространенным средством реализации баз данных являются СУБД.
Жизненный цикл создания баз данных включает этапы проектирования, реализации и эксплуатации. На этапе проектирования базы данных создается ее структура. На этапе реализации базы данных выполняется материализация проекта с помощью одного из средств реализации баз данных. На этапе эксплуатации выполняется наполнение проекта конкретной информацией и ее обновление.
К основным этапам проектирования баз данных относятся следующие этапы:
1. Анализ предметной области и определение требований к базе данных.
2. Концептуальное (инфологическое) проектирование базы данных.
3. Выбор средства реализации базы данных.
4. Логическое (датологическое) проектирование базы данных.
5. Физическое проектирование базы данных.
При определении требований к базе данных выполняется оценка качественных и количественных критериев. К качественным критериям относятся возможность восстановления базы данных после сбоев, возможность расширения или изменения структуры базы данных, наличие средств защиты информации, обеспечение целостности данных и другие критерии. К количественным критериям относятся ограничения на объем данных, ограничения на время отклика на запросы пользователей, стоимость хранения данных, стоимость обновления и другие критерии.
Задача инфологического (концептуального) этапа проектирования баз данных - построение семантических (смысловых) моделей данных.
Задача логического этапа проектирования баз данных - организация данных в виде структур данных или выбор и построение модели данных логического уровня представления данных.
Задача физического этапа проектирования баз данных - выбор рациональной структуры хранения данных и методов доступа к ним, исходя из того арсенала методов и средств, который представляется разработчику после выбора средства реализации базы данных и этапа логического проектирования.
В современных информационных технологиях встречается не только понятие базы данных, но и базы знаний, банка данных, систем баз данных.
База знаний – это не только совокупность данных, но и совокупность знаний и набора правил вывода новых знаний. Аналогом СУБД для баз данных является понятие экспертной системы для баз знаний. Экспертные системы– это управляющая система, интерпретирующая правила вывода при работе с базами знаний
Банк данных–это информационная система, реализующая централизованное управление данными. В состав банка данных входят база данных, СУБД, словарь данных, вычислительная системы, администратор базы данных. Таким образом, банк данных более широкое понятие по сравнению с базами данных. Иногда ставят тождество между понятием банка данных и понятием автоматизированной информационной системы. Банк данных, как и любая автоматизированная система, имеет пять основных видов обеспечений: программное обеспечение, информационное, техническое, организационно-методическое и правовое.
Система баз данных – автоматизированная система хранения и обработки данных, то есть фактически это определение автоматизированной информационной системы и банка данных. В настоящее время системы баз данных делят на системы оперативной (иногда называют операционной) обработки данных или системы OLTP (OnLine Transaction Processing), а также системы аналитической обработки данных или OLAP (OnLine Analytikal Processing). Цели этих систем и поэтому модели представления данных в таких системах существенно отличаются. В данном учебном пособии будут рассмотрены системы баз данных OLTP.
Глава 1. Модели данных