Понятие базы данных и банка данных.
В настоящее время термины "База данных" и "Система управления базами данных (СУБД)" используются исключительно как относящиеся к компьютерам.
База данных представляет собой совокупность связанных данных конкретной предметной области разнообразного назначения.
Основное различие между базой данных и файлом состоит в том, что база данных имеет несколько значений, соответствующих различным представлениям о хранимых данных.
Несколько значений может иметь и файл , но соответствует при этом лишь одному представлению. Представление – это внешний вид (упорядоченность) представляемой пользователю информации. Несколько представлений файла можно получить лишь сортировкой.
Множество назначений базы данных возникает вследствие ее эксплуатации многими пользователями и использовании одной и той же информации для решения различных задач.
Существуют следующие способы организации базы данных:
· как совокупность локальных файлов, поддерживаемых функциональными пакетами прикладных программ:
· достоинства - более быстрое время обработки данных;
· недостатки - дублирование данных в различных файлах, несогласованность данных в разных приложениях, негибкость доступа к информации;
· применение - в специализированных приложениях, требующих высокую скорость реакции при импорте необходимых данных);
· интегрированная база данных (или просто база данных), которая основывается на использовании универсальных программных средств загрузки, хранения, поиска и ведения данных, т.е. СУБД.
Интегрированная база данных - это совокупность взаимосвязанных, хранящихся вместе данных при такой минимальной избыточности, которая допускает их использование оптимальным образом для множества приложений.
Достоинства:
· обеспечение совместимость данных;
· уменьшение синтаксическую и семантическую избыточность;
· соответствие хранимых данных реальному состоянию объекта;
· разделение хранения данных между пользователями;
· возможность подключения новых пользователей.
Недостатки:
· необходимость усиления контроля вводимых данных;
· обеспечение согласования между пользователями по поводу состава и структуры данных;
· разграничение доступа и секретности данных.
Основными способами организации базы данных являются создание централизованных и распределенных баз данных (клиент-серверные архитектуры).
Основными критериями при выборе способа организации базы данных являются минимизация трудовых и стоимостных затрат на проектирование структуры базы данных, программного обеспечения системы ведения файлов и др., а также на перепроектирование при возникновении новых задач.
К организации базы данных предъявляются следующие требования:
· логическая и физическая независимость данных ( программ от мизменения структуры базы данных);
· контролируемая избыточность данных;
· стандартизация данных за счет использования классификаторов;
· наличие словаря данных;
· специализация интерфейса для администратора БД и пользователя системы;
· контроль целостности данных;
· защита данных от несанкционированного доступа.
Принципами построения централизованной базы данных являются:
· обеспечение логической организации данных с помощью построения глобальной модели данных;
· представление информационных потребностей для каждой задачи в виде подмоделей данных;
· выделение специального языка описания данных для получения схем и подсхем;
· описание процедур обработки с помощью языка манипулирования данными;
· разделение доступа к полям данных;
· защита данных через пароль;
· обеспечение доступности данных одновременно для нескольких пользователей.
Для распределенных баз данных существуют свои требования:
· учет территориального расположения подразделений;
· обеспечение независимости данных от территориального расположения;
· оптимальное расположение БД между абонентами и серверами;
· надежность хранения данных;
· использование СУБД, которые имеют язык описания данных, манипулирования данными и язык запросов, ориентированные на работу сети;
· возможность параллельного обращения к данным из различных узлов обработки данных.
Программное обеспечение, программные средства, программируемая логика и процедуры, осуществляющие управление базой данных, образуют систему управления базами данных (СУБД.).
С базой данных связано несколько пользователей, поэтому постоянно необходимо учитывать различные требования пользователей и разрешать конфликты. Этими вопросами обычно занимается администратор базы данных. Администратор базы данных должен координировать действия по сбору сведений, проектированию, реализации и ведению базы данных, а также по обеспечению защиты данных.
Для эффективного использования средств автоматизации необходимо создавать банк данных. Банк данных включает базу данных, систему управления базой данных, пакеты прикладных программ, словарь базы данных.
Словарь данных содержит информацию обо всех ресурсах данных. Одно из главных назначений словаря состоит в документировании данных. Т.к. база данных обслуживает многих пользователей, то необходимо, чтобы они правильно понимали, что представляют собой данные. Накоплении информации о данных в словаре данных целесообразно начинать уже на самой ранней стадии проектирования.
Процесс проектирования базы данных начинается с установления концептуальных требований пользователей. Эти требования пользователей интегрируются в едином обобщенном представлении, которое представляет собой концептуальную модель. Концептуальная модель представляет объекты и их взаимосвязи без указания способов их физического хранения.
Версия концептуальной модели, которая может быть реализована конкретной СУБД, называется логической моделью.
Логическая модель отображается в физическую модель, расположенную на магнитном носителе.