Понятие информационной системы, виды структур данных, виды баз данных

ЛЕКЦИЯ 7. Базы данных

Базы данных - важнейшая составная часть информационных систем. Информационные системы предназначены для хранения и обработки больших объемов информации. Изначально такие сис-темы существовали в письменном виде. Для этого использовались различные картотеки, папки, журналы, библиотечные каталоги и т.д. Любая информационная система должна выполнять три основ-ные функции: ввод данных, запросы по данным, составление отче-тов. Ввод данных. Система должна предоставлять возможность на-капливания и упорядочивания данных. Необходимо обеспечить просмотр этих данных, внесение в них изменений и дополнений с тем, чтобы поддерживать актуальность информации. Запросы по данным. В системе должна существовать возмож-ность находить и просматривать отдельные части накопленной информации. Составление отчетов. Время от времени возникает необходи-мость обобщать и анализировать большую группу данных (или даже все данные) информационной системы, представляя ее в виде документа. Обслуживание информационных систем, реализованных в письменном (бумажном) виде, сопряжено со многими трудностя-ми: чем больше информационная система, тем больше бумаги (карточек) и места требуется для их хранения (в этом можно убе-диться на примере библиотеки); много времени тратится на поиск нужной информации. Сложности возникают при обновлении, ана-лизе и обработке данных. В широком смысле база данных — это совокупность сведений о конкретных объектах реального мира в какой-либо предметной об-ласти. Под предметной областью принято понимать часть реального мира, подлежащего изучению для организации управления и в ко-нечном счете автоматизации, например, предприятие, вуз и т.д. База данных (БД) — это поименованная совокупность структу-рированных данных, относящихся к определенной предметной об-ласти. Структурированные и неструктурированные виды данных Создавая базу данных, пользователь стремится упорядочить ин-формацию по различным признакам и быстро извлекать выборку с произвольным сочетанием признаков. Сделать это возможно, толь-ко если данные структурированы. Структурирование — это введе-ние соглашений о способах представления данных. Неструктури-рованными называют данные, записанные, например, в текстовом файле. Пример неструктурированных данных, содержащих сведения о студентах (номер личного дела, фамилию, имя, отчество и год рож-дения). Легко убедиться, что сложно организовать поиск необходи-мых данных, хранящихся в неструктурированном виде, а упорядо-чить подобную информацию практически не представляется реаль-ным.

Личное дело № 16493, Сергеев Петр Михайлович, дата рождения 1 января 1976 г.; Л/д № 16593, Петрова Анна Владимировна, дата рожд. 15 марта 1975 г.; № личн. дела 16693, д.р. 14.04.76, Анохин Андрей Борисович. Чтобы автоматизировать поиск и систематизировать эти данные, необходимо выработать определенные соглашения о способах представления данных, т.е. дату рождения нужно записывать оди-наково для каждого студента, она должна иметь одинаковую длину и определенное место среди остальной информации. Эти же заме-чания справедливы и для остальных данных (номер личного дела, фамилия, имя, отчество). Пример 1. После проведения несложной структуризации с ин-формацией, указанной в примере, она будет выглядеть так, как это показано на рис. 1.

№ личного дела Фамилия Имя Отчество Дата рож-дения 16493 Сергеев Петр Михайло-вич 01.01.76 16593 Петрова Анна Владими-ровна 15.03.75 16693 Анохин Андрей Борисович 14.04.76 Рис. 1. Пример структурированных данных Пользователями базы данных могут быть различные прикладные программы, программные комплексы, а также специалисты пред-метной области, выступающие в роли потребителей или источников данных, называемые конечными пользователями. В современной технологии баз данных предполагается, что соз-дание базы данных, ее поддержка и обеспечение доступа пользова-телей к ней осуществляются централизованно с помощью специ-ального программного инструментария — системы управления ба-зами данных.

Классификация баз данных По технологии обработки данных базы данных подразделяются на централизованные и распределенные. Централизованная база данных хранится в памяти одной вычис-лительной системы. Если эта вычислительная система является компонентом сети ЭВМ, возможен распределенный доступ к такой базе. Такой способ использования баз данных часто применяют в локальных сетях ПК. Распределенная база данных состоит из нескольких, возможно пересекающихся или даже дублирующих друг друга частей, храни-мых в различных ЭВМ вычислительной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД). По способу доступа к данным базы данных разделяются на базы данных с локальным доступом и базы данных с удаленным (сете-вым) доступом. Системы централизованных баз данных с сетевым доступом предполагают различные архитектуры подобных систем: • файл-сервер; • клиент-сервер.

Файл-сервер. Архитектура систем БД с сетевым доступом пред-полагает выделение одной из машин сети в качестве центральной (сервер файлов). На такой машине хранится совместно используе-мая централизованная БД. Все другие машины сети выполняют функции рабочих станций, с помощью которых поддерживается доступ пользовательской системы к централизованной базе данных. Файлы базы данных в соответствии с пользовательскими запросами передаются на рабочие станции, где в основном и производится об-работка. При большой интенсивности доступа к одним и тем же данным производительность информационной системы падает. Пользователи могут создавать также на рабочих станциях локаль-ные БД, которые используются ими монопольно. Концепция файл-сервер условно отображена на рис. 2. Клиент-сервер. В этой концепции подразумевается, что помимо хранения централизованной базы данных центральная машина (сер-вер базы данных) должна обеспечивать выполнение основного объ-ема обработки данных. Запрос на данные, выдаваемый клиентом (рабочей станцией), порождает поиск и извлечение данных на сер-вере. Извлеченные данные (но не файлы) транспортируются по сети от сервера к клиенту. Спецификой архитектуры клиент-сервер явля-ется использование языка запросов SQL. Концепция клиент-сервер условно изображена на рис. 3.

Рис. 2. Схема обработки информации Рис. 3.Схема обработки информации в БД по принципу файл-сервер в БД по принципу клиент-сервер