Недостатки традиционных файловых систем

 

Продолжающийся значительный рост в различных областях промышленности, в управлении и научных исследованиях привел к автоматизации обработки огромнейшего количества данных. В конце 1960-х – начале 1970-х годов коммерческие, правительственные и другие организации начали накапливать и хранить данные в виде файлов, доступных ЭВМ. Простейший подход к обработке данных в файловых системах состоит в разработке для отдельного приложения одной или нескольких специальных программ. В качестве примера можно привести банковские операции формирования расходных и приходных счетов, учета взносов и ссуд по закладным. Такой способ отражен на рис. 1.1.

 

 

Рис. 1.1

Любому приложению предметной области, такому, как приход, расход, взнос по закладным, ссуда по закладным, соответствует свое представление о данных. Первоначально прикладному программисту приходилось разрабатывать подпрограммы обслуживания файлов, которые обеспечивали удаление, добавление, замену и поиск данных в файлах, обрабатываемых программой.

Шагом вперед явилось создание универсальных подпрограмм. Универсальные подпрограммы (рис. 1.2) обеспечивают заранее определенные «методы доступа», освобождающие прикладного программиста от необходимости кодирования, тестирования и «отладки» специфичных для данного приложения методов. Эти подпрограммы реализуют обобщенные методы доступа, позволяющие добавлять, удалять, заменять и искать данные, расположенные на таких внешних носителях, как лента, диск или барабан. Обобщенные методы доступа стали составной частью «операционных подсистем».

 
 

 

Рис. 1.2

 

Однако большинство универсальных методов доступа не позволяет другим прикладным программам с отличным представлением об общих данных параллельно использовать эти данные и осуществлять к ним доступ. Все пользователи ограничены единственным представлением о данных.

Для файловых систем характерна тесная связь между физическими данными и прикладной программой. В них отсутствуют почти все гибкие средства, предлагаемые СУБД. Следовательно, большинство необходимых свойств должна поддерживать программа пользователя. Другими словами, кроме логики прикладной задачи пользователь должен обеспечивать средства логического представления данных, интерпретировать операции над этим представлением, переводить их в примитивные файловые операции и следить за поддержкой файлов, содержащих физические данные. При таком режиме работы достичь независимости данных было бы невозможно. Любые изменения непосредственно влияли бы на прикладную программу. Тесная связь между приложением пользователя и физическими данными не позволила бы организовать совместное использование данных несколькими пользователями, так как они могут представлять эти данные и манипулировать ими по-разному. Это в свою очередь приводит к необходимости дублирования данных в различных приложениях. Кроме неэффективности и дополнительных затрат памяти при отсутствии общего механизма, динамически отражающего модификации одного приложения в данных другого приложения, прямым следствием дублирования является рассогласование базы данных. Например, некоторый товар может быть отправлен из магазина или списан с соответствующим изменением в файле данных магазина, а финансовый отдел может ничего не знать об этом (из-за отсутствия интегрированной динамичной информационной системы) и периодически запрашивать отчеты об этом товаре от различных подчиненных отделов.

В файловых системах динамика отсутствует в том смысле, что прикладные программы разрабатываются, кодируются, отлаживаются и каталогизируются для заранее предусмотренных запросов и приложений. Они не могут справиться с нетипичными запросами, которые обычно требуют ответа в реальном времени. Ниже перечислены проблемы, возникающие в файловых системах:

· зависимость данных;

· жесткость (статичность) структуры данных и программ;

· отсутствие интеграции;

· дублирование данных, избыточность данных;

· проблемы непротиворечивости данных;

· невозможность совместного использования;

· неэффективность;

· невозможность обработки нетипичных запросов;

· ограниченное разделение данных;

· ограничения по доступности данных;

· сложности в управлении.

Избыточность данных

Некоторые элементы данных, такие, как имя, адрес и идентификационный номер клиента, неизбежно используются во многих прикладных программах. Поскольку данные требуются нескольким прикладным программам, они часто записываются в несколько файлов, т.е. одни и те же данные хранятся в разных местах. Такое положение называют «избыточностью данных». Оно делает проблематичным обеспечение непротиворечивости данных. Избыточность данных требует наличия нескольких процедур ввода, обновления и формирования отчетов.

Проблемы непротиворечивости данных

Одной из причин нарушения непротиворечивости данных является их избыточность, что связано с хранением одной и той же информации в нескольких местах. Например, адрес одного и того же клиента хранится в четырех различных наборах данных: файле данных расходных счетов, файле данных приходных счетов, файле данных взносов по закладной и файле данных ссуд по закладной. При смене местожительства клиента необходимо изменить его адрес в четырех местах. Зачастую по разным причинам выполнить это не удается. В результате об одном и том же объекте предметной области в разных местах хранится различная информация.

Нарушение непротиворечивости данных может также являться следствием недостаточного контроля их достоверности в случае внесения изменений. При попытках объединить данные до появления технологии баз данных пришлось столкнуться с целым рядом трудностей, в частности, из-за:

· недостаточности средств защиты хранимых данных;

· неадекватности процедур восстановления после возникновения отказов;

· трудностей по обеспечению ведения длинных записей;

· негибкости к изменениям;

· высокой стоимости программирования и сопровождения;

· сложности процедур управления эксплуатацией ЭВМ (небрежность и ошибки).

 

Ограниченное разделение данных

Поскольку в нашем примере прикладные программы расхода, прихода, взносов по закладной и ссуд по закладной обеспечивают обработку данных одной организации, между элементами данных различных файлов существует некоторая взаимосвязь. Однако когда файлы реализованы в виде отдельных единиц, установление связей между элементами данных посредством прикладных программ затруднительно или вообще невозможно. Если предметная область соответствует организации, функционирующей как единое целое, необходимо разделить данные между различными файлами.

Ограничения по доступности данных

В современных условиях, когда обстановка быстро изменяется, лицо с соответствующими правами доступа должно иметь возможность получить данные за приемлемый отрезок времени. Если же данные разбросаны по нескольким файлам, доступность данных, комбинируемых из этих файлов, ограничена.

Сложности в управлении

Из-за избыточности данных в файлах трудно реализовать новые директивы по всей предметной области. Для решения вышеуказанных проблем были разработаны системы с базами данных.