Понятие информационной базы и способы ее организации
Основной частью внутримашинного информационного обеспечения является информационная база. Информационная база (ИБ) - это определенным способом организованная совокупность данных, хранимых в памяти вычислительной системы в виде файлов, с помощью которых удовлетворяются информационные потребности управленческих процессов и решаемых задач.
Файл - это некоторое множество записей однородной структуры, предназначенное для решения экономических задач. Запись - это набор полей определенного формата, объединенных по общему ключевому полю. Все файлы ЭИС можно классифицировать по следующим признакам:
• по этапам обработки (входные, базовые, результатные);
• по типу носителя (на промежуточных носителях - гибких магнитных дисках и магнитных лентах и на основных носителях -жестких магнитных дисках, магнитооптических дисках и др.);
• по составу информации (файлы с оперативной информацией и файлы с постоянной информацией);
• по назначению (по типу функциональных подсистем); т
• по типу логической организации (файлы с линейной и иерархической структурой записи, реляционные, табличные);
• по способу физической организации (файлы с последовательным, индексным и прямым способом доступа).
Входные файлы создаются с первичных документов для ввода данных или обновления базовых файлов.
Файлы с результатной информацией предназначаются для вывода ее на печать или передачи по каналам связи и не подлежат долговременному хранению.
К числу базовых файлов, хранящихся в информационной базе, относят основные, рабочие, промежуточные, служебные и архивные файлы.
Основные файлы должны иметь однородную структуру записей и могут содержать записи с оперативной и условно-постоянной информацией. Оперативные файлы могут создаваться на базе одного или нескольких входных файлов и отражать информацию одного или нескольких первичных документов. Файлы с условно-постоянной информацией могут содержать справочную, расценочную, табличную и другие виды информации, изменяющейся в течение года не более чем на 40 %, а следовательно, имеющие коэффициент стабильности (Кст) не менее 0,6.
Файлы со справочной информацией должны отражать все характеристики элементов материального производства (материалы, сырье, основные фонды, трудовые ресурсы и т.п.). Как правило, справочники содержат информацию классификаторов и дополнительные сведения об элементах материальной сферы, например о ценах. Нормативно-расценочные файлы должны содержать данные о нормах расхода и расценках на выполнение операций и услуг. Табличные файлы содержат сведения об экономических показателях, считающихся постоянными в течение длительного времени (например, процент удержаний, отчислений и пр.). Плановые файлы содержат плановые показатели, хранящиеся весь плановый период.
Рабочие файлы создаются для решения конкретных задач на базе основных файлов путем выборки части информации из нескольких основных файлов с целью сокращения времени обработки данных.
Промежуточные файлы отличаются от рабочих файлов тем, что они образуются в результате решения экономических задач, подвергаются хранению с целью дальнейшего использования для решения других задач. Эти файлы, так же как и рабочие файлы, при высокой частоте обращений могут быть также переведены в категорию основных файлов.
Служебные файлы предназначаются для ускорения поиска информации в основных файлах и включают в себя справочники, индексные файлы и каталоги.
Архивные файлы содержат ретроспективные данные из основных файлов, которые используются для решения аналитических, например прогнозных, задач. Архивные данные могут также использоваться для восстановления информационной базы при разрушениях.
Организация хранения файлов в информационной базе должна отвечать следующим требованиям:
• полнота хранимой информации для выполнения всех функций управления и решения экономических задач;
• целостность хранимой информации, т.е. обеспечение непротиворечивости данных при вводе информации в ИБ;
• своевременность и одновременность обновления данных во всех копиях данных;
• гибкость системы, т.е. адаптируемость ИБ к изменяющимся информационным потребностям;
• реализуемость системы, обеспечивающая требуемую степень сложности структуры ИБ;
• релевантность ИБ, под которой подразумевается способность системы осуществлять поиск и выдавать информацию, точно соответствующую запросам пользователей;
• удобство языкового интерфейса, позволяющее быстро формулировать запрос к ИБ;
• разграничение прав доступа, т.е. определение для каждого пользователя доступных типов записей, полей, файлов и видов операций над ними.
Существуют следующие способы организации ИБ: совокупность локальных файлов, поддерживаемых функциональными пакетами прикладных программ, и интегрированная база данных, основывающаяся на использовании универсальных программных средств загрузки, хранения, поиска и ведения данных, т.е. системы управления базами данных (СУБД).
Локальные файлы вследствие специализации структуры данных под задачи обеспечивают, как правило, более быстрое время обработки данных. Однако недостатки организации локальных файлов, связанные с большим дублированием данных в информационной системе и, как следствие, несогласованностью данных в разных приложениях, а также негибкостью доступа к информации, перекрывают указанные преимущества. Поэтому организация локальных файлов может применяться только в специализированных приложениях, требующих очень высокую скорость реакции, при импорте необходимых данных.
Интегрированная ИБ, т.е. база данных (БД), - это совокупность взаимосвязанных, хранящихся вместе данных при такой минимальной избыточности, которая допускает их использование оптимальным образом для множества приложений.
Централизация управления данными с помощью СУБД обеспечивает совместимость этих данных, уменьшение синтаксической и семантической избыточности, соответствие данных реальному состоянию объекта, разделение хранения данных между пользователями и возможность подключения новых пользователей. Но централизация управления и интеграция данных приводят к проблемам другого характера: необходимости усиления контроля вводимых данных, необходимости обеспечения соглашения между пользователями по поводу состава и структуры данных, разграничения доступа и секретности данных.
Основными способами организации БД являются создание централизованных и распределенных БД. Основным критерием выбора способа организации ИБ является достижение минимальных трудовых и стоимостных затрат на проектирование структуры ИБ, программного обеспечения системы ведения файлов, а также на перепроектирование ИБ при возникновении новых задач.
К организации БД предъявляются следующие основные требования:
• логическая и физическая независимость данных (программ от изменений структуры БД);
• контролируемая избыточность данных;
• стандартизация данных за счет использования классификаторов;
• наличие словаря данных;
• специализация интерфейса для администратора БД и пользователя системы;
• контроль целостности данных;
• защита данных от несанкционированного доступа;
• наличие вспомогательных программных средств (утилит) проектирования и эксплуатации БД.
Принципами построения централизованной БД являются:
• обеспечение логической организации данных с помощью построения глобальной модели данных;
• представление информационных потребностей для каждой задачи в виде подмоделей данных;
• выделение специального языка описания данных для получения схем и подсхем;
• описание процедур обработки данных с использованием языка манипулирования данными;
• разделение доступа к полям данных;
• защита данных через пароль;
• обеспечение доступности данных одновременно для нескольких пользователей.
Дня распределенных БД существуют свои требования (подробнее см. гл. 12):
• учет территориального расположения подразделений ЭИС;
• обеспечение независимости данных от их территориального расположения;
• оптимальное размещение БД между абонентами и серверами;
• сокращение стоимости информационного обслуживания абонентов;
• обеспечение решения сложных межведомственных задач;
• надежность хранения обработки данных; использование СУБД, которые имеют язык описания данных, манипулирования данными и язык запросов, ориентированные на работу в сети;
• возможность параллельного обращения к данным из различных узлов обработки данных.