Банк данных.

Избыточность данных.

Изменчивость данных.

Выборочность обработки данных.

 

Коэффициент выборочности данных - это отношение количества обработанных записей (Na) к числу всех записей (N).

Кв = Na/N

Если коэффициент выборочности близок к 0, низкий, то используют прямые методы доступа, если к 1, то последовательные методы доступа (сплошная выборка).

 

Изменчивость данных - это характеристика количества изменений базы данных (файла) за некоторый интервал времени.

Изменчивые (динамичные) файлы - это файлы, данные в которых часто меняются.

Статичные (постоянные, условно-постоянные) файлы - это файлы, данные в которых редко меняются.

Примером постоянных файлов могут служить: классификаторы, номенклаторы, справочники различных коэффициентов и некоторые другие файлы нормативно-справочной информации (НСИ).

 

Избыточность (дублирование) - это характеристика, определяемая отношением количества дублированных (повторившихся) данных (Vd) ко всему объему данных (V).

Kd = Vd/V

Чем ближе Kd к 0, тем лучше.

В рассмотренном выше примере данных об узлах и деталях, представленных двумя структурами данных - линейной и иерархической, хорошо иллюстрируется дублирование данных в линейной структуре (дублируются значения поля “узел” для разных деталей, входящих в один узел). В иерархической структуре дублирование полей отсутствует.

Определение банка данных из ОРММ ГКНТ (1982г):

Банк данных - это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных”.

Принципы банка данных.

- независимость данных;

- неизбыточность данных;

- универсальность;

- совместимость;

- защита данных;

- управление одновременной работой;

- поддержка распределенной системы баз данных.

Не рассматривая подробно, приведем определение указанных выше принципов.

Под независимостью данных понимается такой принцип построения структуры данных и их размещения в системе, реализации программных, технических, организационных элементов информационной системы, который обеспечивает минимум затрат при внесении различных изменений в систему в течение ее жизненного цикла. Одним из основных средств обеспечения независимости данных является применение систем управления базами данных (СУБД) при разработке ИС.

Обычно выделяют два вида независимости данных - логическую и физическую. Логическая независимость данных означает, что общая логическая структура данных может быть изменена без изменения действующих прикладных программ. Например, могут быть добавлены в логическую структуру новые группы данных (сегменты, агрегаты), установлены дополнительные связи между данными и т.п. Физическая независимость данных означает, что физическое расположение и организация данных могут изменяться, но при этом логическая структура данных, программы не изменяются. Например, может быть изменен тип носителя информации (физическое устройство), метод доступа (индексно-последовательный на прямой и т.п.), размещение информации на носителе и так далее. Независимость данных обеспечивает эволюцию информационной системы при совершенствовании технических, программных, информационных средств.

Другими словами, независимость данных - это свойство системы, дающее возможность изменять логическую и физическую структуру данных без изменения при этом прикладных программ.

Неизбыточность данных - это свойство системы, позволяющее вводить и хранить данные один раз с оптимальным использованием в различных приложениях. Под избыточностью понимается использование одного и того же экземпляра данного в разных структурах данных (файлах, базах), что при изменении данного приведет к необходимости изменять экземпляры данных во всех структурах, где эти данные встречаются, и что приводит к дополнительным затратам. При этом дублирование (копирование) информации для сохранения и восстановления данных не относится к понятию избыточности данных. При разработке ИС в ряде случаев, обусловленных техническими или экономическими причинами, приходится идти на определенный компромисс и допускать избыточность данных в некоторой минимальной степени.

Универсальность - это свойство системы поддерживать и отображать в структуре данных возможно максимальный круг объектов, процессов, явлений.

Совместимость - это свойство системы обеспечивать преемственность более поздних версий системы по отношению к ранее созданным информационным фондам, а также наличие интерфейсов для приема/передачи данных в другие информационные системы.

Защита данных - это свойство системы, обеспечивающее защиту данных от разрушений (аппаратных и программных сбоев, физического разрушения и т.д.) и несанкционированного доступа.

Управление одновременной работой - это свойство системы обеспечить согласованное параллельное выполнение нескольких процессов обработки данных для различных пользователей.

Поддержка распределенной системы баз данных - это способность системы обрабатывать территориально разнесенную информацию (в разных местах и в различных вычислительных системах) как единую взаимосвязанную совокупность данных.