Понятие информационной базы и способы ее организации

Основной частью внутримашинного информационного обес­печения является информационная база. Информационная база (ИБ) - это определенным способом организованная совокуп­ность данных, хранимых в памяти вычислительной системы в виде файлов, с помощью которых удовлетворяются информа­ционные потребности управленческих процессов и решаемых задач.

Файл - это некоторое множество записей однородной струк­туры, предназначенное для решения экономических задач. Запись - это набор полей определенного формата, объединенных по общему ключевому полю. Все файлы ЭИС можно классифи­цировать по следующим признакам:

по этапам обработки (входные, базовые, результатные);

по типу носителя (на промежуточных носителях - гибких маг­нитных дисках и магнитных лентах и на основных носителях -жестких магнитных дисках, магнитооптических дисках и др.);

по составу информации (файлы с оперативной информацией и файлы с постоянной информацией);

по назначению (по типу функциональных подсистем); т

по типу логической организации (файлы с линейной и иерархи­ческой структурой записи, реляционные, табличные);

по способу физической организации (файлы с последовательным, индексным и прямым способом доступа).

Входные файлы создаются с первичных документов для вво­да данных или обновления базовых файлов.

Файлы с результатной информацией предназначаются для вывода ее на печать или передачи по каналам связи и не подле­жат долговременному хранению.

К числу базовых файлов, хранящихся в информационной базе, относят основные, рабочие, промежуточные, служебные и архи­вные файлы.

Основные файлы должны иметь однородную структуру запи­сей и могут содержать записи с оперативной и условно-постоян­ной информацией. Оперативные файлы могут создаваться на базе одного или нескольких входных файлов и отражать информацию одного или нескольких первичных документов. Файлы с условно-постоянной информацией могут содержать справочную, расценоч­ную, табличную и другие виды информации, изменяющейся в течение года не более чем на 40 %, а следовательно, имеющие коэффициент стабильности (Кст) не менее 0,6.

Файлы со справочной информацией должны отражать все ха­рактеристики элементов материального производства (материа­лы, сырье, основные фонды, трудовые ресурсы и т.п.). Как пра­вило, справочники содержат информацию классификаторов и дополнительные сведения об элементах материальной сферы, например о ценах. Нормативно-расценочные файлы должны со­держать данные о нормах расхода и расценках на выполнение операций и услуг. Табличные файлы содержат сведения об эконо­мических показателях, считающихся постоянными в течение дли­тельного времени (например, процент удержаний, отчислений и пр.). Плановые файлы содержат плановые показатели, хранящи­еся весь плановый период.

Рабочие файлы создаются для решения конкретных задач на базе основных файлов путем выборки части информации из не­скольких основных файлов с целью сокращения времени обра­ботки данных.

Промежуточные файлы отличаются от рабочих файлов тем, что они образуются в результате решения экономических задач, подвергаются хранению с целью дальнейшего использования для решения других задач. Эти файлы, так же как и рабочие файлы, при высокой частоте обращений могут быть также переведены в категорию основных файлов.

Служебные файлы предназначаются для ускорения поиска информации в основных файлах и включают в себя справочни­ки, индексные файлы и каталоги.

Архивные файлы содержат ретроспективные данные из основ­ных файлов, которые используются для решения аналитических, например прогнозных, задач. Архивные данные могут также ис­пользоваться для восстановления информационной базы при раз­рушениях.

Организация хранения файлов в информационной базе дол­жна отвечать следующим требованиям:

• полнота хранимой информации для выполнения всех функ­ций управления и решения экономических задач;

• целостность хранимой информации, т.е. обеспечение непро­тиворечивости данных при вводе информации в ИБ;

• своевременность и одновременность обновления данных во всех копиях данных;

• гибкость системы, т.е. адаптируемость ИБ к изменяющимся информационным потребностям;

• реализуемость системы, обеспечивающая требуемую степень сложности структуры ИБ;

• релевантность ИБ, под которой подразумевается способность системы осуществлять поиск и выдавать информацию, точно соответствующую запросам пользователей;

• удобство языкового интерфейса, позволяющее быстро фор­мулировать запрос к ИБ;

• разграничение прав доступа, т.е. определение для каждого пользователя доступных типов записей, полей, файлов и ви­дов операций над ними.

Существуют следующие способы организации ИБ: совокуп­ность локальных файлов, поддерживаемых функциональными пакетами прикладных программ, и интегрированная база данных, основывающаяся на использовании универсальных программных средств загрузки, хранения, поиска и ведения данных, т.е. систе­мы управления базами данных (СУБД).

Локальные файлы вследствие специализации структуры дан­ных под задачи обеспечивают, как правило, более быстрое время обработки данных. Однако недостатки организации локальных файлов, связанные с большим дублированием данных в инфор­мационной системе и, как следствие, несогласованностью дан­ных в разных приложениях, а также негибкостью доступа к ин­формации, перекрывают указанные преимущества. Поэтому организация локальных файлов может применяться только в спе­циализированных приложениях, требующих очень высокую ско­рость реакции, при импорте необходимых данных.

Интегрированная ИБ, т.е. база данных (БД), - это совокупность взаимосвязанных, хранящихся вместе данных при такой мини­мальной избыточности, которая допускает их использование оп­тимальным образом для множества приложений.

Централизация управления данными с помощью СУБД обес­печивает совместимость этих данных, уменьшение синтаксичес­кой и семантической избыточности, соответствие данных реаль­ному состоянию объекта, разделение хранения данных между пользователями и возможность подключения новых пользовате­лей. Но централизация управления и интеграция данных приво­дят к проблемам другого характера: необходимости усиления контроля вводимых данных, необходимости обеспечения согла­шения между пользователями по поводу состава и структуры дан­ных, разграничения доступа и секретности данных.

Основными способами организации БД являются создание централизованных и распределенных БД. Основным критерием выбора способа организации ИБ является достижение минималь­ных трудовых и стоимостных затрат на проектирование структу­ры ИБ, программного обеспечения системы ведения файлов, а также на перепроектирование ИБ при возникновении новых задач.

К организации БД предъявляются следующие основные тре­бования:

• логическая и физическая независимость данных (программ от изменений структуры БД);

• контролируемая избыточность данных;

• стандартизация данных за счет использования классифика­торов;

• наличие словаря данных;

• специализация интерфейса для администратора БД и пользо­вателя системы;

• контроль целостности данных;

• защита данных от несанкционированного доступа;

• наличие вспомогательных программных средств (утилит) про­ектирования и эксплуатации БД.

Принципами построения централизованной БД являются:

• обеспечение логической организации данных с помощью по­строения глобальной модели данных;

• представление информационных потребностей для каждой задачи в виде подмоделей данных;

• выделение специального языка описания данных для получе­ния схем и подсхем;

• описание процедур обработки данных с использованием язы­ка манипулирования данными;

• разделение доступа к полям данных;

• защита данных через пароль;

• обеспечение доступности данных одновременно для несколь­ких пользователей.

Дня распределенных БД существуют свои требования (подроб­нее см. гл. 12):

• учет территориального расположения подразделений ЭИС;

• обеспечение независимости данных от их территориального расположения;

• оптимальное размещение БД между абонентами и серверами;

• сокращение стоимости информационного обслуживания або­нентов;

• обеспечение решения сложных межведомственных задач;

• надежность хранения обработки данных; использование СУБД, которые имеют язык описания данных, манипулиро­вания данными и язык запросов, ориентированные на работу в сети;

• возможность параллельного обращения к данным из различ­ных узлов обработки данных.