АВТОМАТИЗИРОВАННЫЙ БАНК ДАННЫХ

Тема 3. Технология баз информации

1. Автоматизированный банк данных.

2. Базы данных и требования к ним

3. Модели описания данных.

4. Системы управления базами данных.

5. Автоматизированные банки документов и знаний.

Современной формой организации информационных сис­тем являются банки данных, которые представляют собой:

· систему информационных, математических, программ­ных, языковых, организационных и технических средств, предназначенных для централизованного на­копления и коллективного использования с целью по­лучения необходимой информации;

  • сложную информационную систему, на вход которой поступают исходные данные, а на выходе пользователь получает результатную информацию;
  • информационную модель объекта, информация о котором необходима для обеспечения управления этим объектом.

Автоматизированный банк данных включает:

· вычислительную систему;

· одну или несколько баз данных;

· набор прикладных программ пользователей;

· систему управления базами данных;

  • языковые средства (языки программирования, языки запросов и ответов, языки описания данных);
  • методические средства (инструкции и рекомендации по созданию и функционированию банков данных, выбору системы управления базами данных);
  • техническую составляющую, основой которой является компьютер, удовлетворяющий по своим техническим ха­рактеристикам определенным требованиям.

Преимущества работы с банком данных:

· повышается производительность труда пользователей и уровень удовлетворения их информационных потреб­ностей;

· прикладные программисты освобождаются от необхо­димости организации данных за счет централизованно­го управления ими;

· обеспечивается независимость прикладных программ от данных;

· снижаются затраты на создание и хранение данных и поддержание их в актуальном состоянии;

· уменьшаются потоки циркулирующих в системе данных.

взаимодействие пользователя

с банками информации

Взаимодействие пользователя с банками информации осу­ществляется посредством информационных языков и языков запросов.

Информационные языки — это искусственные языки, яв­ляющиеся основным средством представления информации для ввода, хранения, поиска и обработки и предназначенные для записи семантической (смысловой) информации с целью последующе­го ее использования в различных системах. Информацион­ный язык должен:

· однозначно представлять информацию на лексическом и грамматическом уровне, так как различная трактов­ка в представлении данных неизбежно приведет к ис­кажению информации;

· иметь достаточную для решения задач степень полноты и детализации представления информации, подлежащей хра­нению и обработке. Документальная автоматизированная база данных создается под круг интересов пользователей и при этом безразлично, каковы состав и глубина описа­ний сведений, которые пользователь будет извлекать из найденного документа. Фактографический автоматизиро­ванный банк данных создается под задачи, решаемые на основе хранимой в нем информации, и они определяют набор хранимых сведении и глубину их описания;

  • быть ориентированным на пользователя-непрограммис­та, максимально опираться на элементы привычного для него естественного языка;
  • обеспечивать стандартное описание однотипных эле­ментов информации и высокую надежность идентифи­кации описаний. Если одни и те же сведения, поступа­ющие в базу данных, будут описаны по-разному, они будут рассматриваться как различные и храниться раз­дельно, что приведет к избыточности данных. Кроме того, банк данных не сможет осуществлять обобщение сведений, относящихся к одному и тому же объекту;
  • допускать возможность внесения изменений и дополне­ний без изменения основ языка. Необходимость изме­нения языка определяется как непрерывным совершен­ствованием задач, так и введением новых задач, кото­рые могут повлечь за собой расширение состава и глу­бины описания фактов.

Языки запросов (языки общения) включают не только сред­ства описания фактов, но и средства, указывающие, какую именно обработку отобранных фактов следует провести, какие элементы описаний и в какой форме следует выдавать.

С авто­матизированным банком данных взаимодействуют источники и пользователи информации (внешние пользователи) и персо­нал банка данных (внутренние пользователи). Источниками информации могут быть конкретный работник, техническое устройство, взаимодействующая с банком данных система, которые передают автоматизированному банку сведения, пред­назначенные для корректировки хранимых в нем данных.

Потребители информации посылают в систему различного вида запросы, которые должны быть гибкими и позволять пользователю просматривать данные так, как это ему необхо­димо. Запрос содержит следующие обязательные элементы: ка­тегорию срочности, номер, указатель отбора, указатель обработки, код пользователя, адрес ответа, указатель выдачи. От автоматизированного банка данных к пользователю поступают сообщения сигнального информирования, сообщения о непра­вильно составленных запросах с отметкой о месте ошибки. Со­общение, содержащее ответы на запросы пользователя, содер­жит обязательные элементы: категорию срочности, номер или содержание запроса, ответ на запрос, время выдачи ответа.

БАЗЫ ДАННЫХ И ТРЕБОВАНИЯ К НИМ

Под базой данных(БД) понимается совокупность взаимосвязанных данных некоторой предметной облас­ти, хранимых в памяти ЭВМ и организованных таким образом, чтобы эти данные могли быть использованы для решения многих задач многими пользователями. Базы данных хранятся на магнитных дис­ках и по мере необходимости считываются в оперативную память ЭВМ, в которой происходит непосредственно их обработка.

База данных — это компьютерная информационная модель внешнего мира, некоторая его предметная область. В ней, как прави­ло, хранятся данные об обьекгах, их свойствах и характеристиках, поскольку во внешнем мире обьекгы взаимосвязаны между собой, в БД эти связи находят отражение.

Успешное функционирование БД может быть осуществлено толь­ко при выполнении ряда требований к ее организации.

Неизбыточность данных. Это требование тесно связано с «интег-рированностыо» БД. Неизбыточность данных предполагает, что в идеале любые данные будут храниться в БД в одном экземпляре. Дублирование данных не только увеличивает объем требуемой памя­ти, но и, самое главное, может легко привести к «противоречивости» данных. Кроме того, дублирование данных увеличивает трудоемкость корректировки базы.

Совместное использование данных. Одни и те же данные базы могут использоваться несколькими пользователями (задачами). При этом желательно, чтобы каждый пользователь (задача) получал эти данные в удобном для него виде. В случае одновременного использования одних и тех же данных разными пользователями (задачами) должен быть обеспечен мультидоступ к данным базы.

Расширяемость базы данных. БД должна обладать способностью к расширению, которое может быть за счет:

1) увеличения числа экземпляров однотипных данных;

2) введения в БД новых типов объектов или новых типов взаимо­связей.

Необходимо, чтобы введение новых типов объектов или связей не требовало каких-либо изменений в уже существующих в БД данных.

Простота работы с базой данных. В условиях разработки и экс­плуатации крупной системы обработки данных важное значение при­обретает простота работы с данными БД, т.е. необходимо, чтобы:

1) структура данных была логичной и ясной;

2)операции доступа к данным обладали ясными и четко очерченными функциями;

3) без больших трудозатрат выполнялись различные обслуживающие операции (копирование, перепись с носителя на носитель,
расширение базы и др.).

Эффективность доступа к базе данных. Под эффективностью здесь понимается обеспечение временных ограничений при доступе пользо­вателей (задач) к данным.

Целостность базы данных. Под целостностью базы данных в общем случае понимается ее готовность к работе. Целостность базы дан­ных — сложное понятие, имеющее много аспектов. Укажем на сле­дующие из них:

1) физическая целостность, т.е. сохранность информации на маг­нитных носителях и корректность форматов данных;

2) логическая целостность, под которой понимается непротиворечивость данных в базе;

3) актуальность данных, т.е. соответствие данных реальному положению вещей.

Потеря целостности базы данных может произойти от сбоев аппара­туры ЭВМ, ошибок в программном обеспечении, при вводе и коррек­тировке данных, низкой достоверности самих данных и т.д., поэтому обеспечить целостность базы реального объема весьма сложно. В то же время потеря целостности данных ведет к самым серьезным последст­виям вплоть до полной перегрузки данных базы. Если учесть, что обычно базы данных накапливаются годами или даже десятками лет, то потеря целостности БД зачастую влечет очень тяжелые последствия.

Конфиденциальность данных. Обеспечение защиты данных от не­санкционированного доступа и модификации, заключающейся в том, что пользователю, не владеющему правами и ключом доступа, пол­ностью закрыт доступ к БД или какой-либо ее части.

Жизненный цикл базы данных включает:

  • стадию анализа, когда происходит формулирование тре­бований концептуального проектирования. Основная его цель состоит в согласовании целей пользователей и их представлений об информационных потоках;
  • стадию проектирования, здесь производится реализация базы данных. Результатом логического проектирования является логическая структура базы данных — функ­циональное описание программных модулей и наборов запросов. Результатом физического проектирования яв­ляется подготовка базы данных к эксплуатации — вы­бор физической структуры базы данных, отладка про­граммных модулей;
  • стадию реализации, когда решаются задачи разработки программ доступа к базе данных.

Структура базы данных может меняться с изменениями в предметной области. Проектирование базы данных начинают с анализа предметной области и выявления требований к ней конечных пользователей.

Администратор базы данных определяет, какие именно дан­ные будут храниться в базе в процессе концептуального про­ектирования, учитывает и объединяет требования разных групп пользователей. После этого создается обобщенное опи­сание создаваемой базы данных с использованием естествен­ного языка, математических формул, графиков.

Следующим этапом является непосредственно формализа­ция представления данных в базе данных.