Введение
В современном мире экономическая и управленческая деятельность, как правило, связана с обработкой большиъ объемов информации. В свою очередь, возникает необходимость хранения столь значительных информационных массивов и быстрого поиска в них необходимых сведений. Существенно облегчить эти задачи позволяют базы данных – специальным образом организованная информация, в которой необходимо осуществить поиск нужных материалов.
Для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации созданы специальные программы – системы управления базами данных.
Важность организации информации в виде баз данных непрерывно возрастает. Таким образом, освоение современных баз данных и систем управления базами данных является одним из важнейших этапов в подготовке квалифицированных специалистов экономичсекого и управленческого профилей. Для подготовки таких специалистов разработаны материалы лекций к курсу. Материалы посвящены, прежде всего, рассмотрению современного состояния и перспектив развития баз данных, а также рассмотрены основные понятия, классификация данных, состав и порядок работ по проектированию баз данных.
Современные информационные системы основаны на концепции интеграции данных. Они характеризуются огромными объемами хранимых данных, сложной организацией, необходимостью удовлетворять разнообразные требования многочисленных пользователей.
Информационная система– система, которая реализует автоматизированный сбор, обработку и манипулирование данными, а также включает технические средства обработки данных, программное обеспечение и соответствующий персонал.
Цельлюбойинформационной системы – обработка данных об объектах реального мира.
Основа информационной системы – база данных. В широком смысле слова база данных – это совокупность сведений о конкретных объектах реального мира в какой-либо предметной области.
Под предметной областьюпринято понимать часть реального мира, подлежащего изучению для организации управления и в конечном счете – автоматизации, например, предприятие, вуз и т.д.
Создавая базу данных, пользователь стремится упорядочить информацию по различным признакам и быстро производить выборку с произвольным сочетанием признаков. Большое значение при этом приобретает структурирование данных.
Структурирование данных– это введение соглашений о способах представления данных.
Неструктурированными называют данные, записанные, например, в текстовом файле.
Посмотрим на пример неструктурированных и структурированных данных, содержащих сведения о студентах (номер личного дела, фамилию, имя, отчество и год рождения).
Неструктурированные данные:
Личное дело № 16493. Сергеев Петр Михайлович, дата рождения 1 января 1976 г.; Л/д № 16593, Петрова Анна Владимировна, дата рожд. 15 марта 1975 г.; № личн. дела 16693, д.р. 14.04.76, Анохин Андрей Борисович
Легко убедиться, что сложно организовать поиск необходимых данных, хранящихся в неструктурированном виде.
Структурированные данные:
№ личного дела | Фамилия | Имя | Отчество | Дата рождения |
Сергеев | Петр | Михайлович | 01.01.76 | |
Петрова | Анна | Владимировна | 15.03.75 | |
Анохин | Андрей | Борисович | 14.04.76 |
Чтобы автоматизировать поиск и систематизировать эти данные, необходимо выработать определенные соглашения о способах представления данных, т.е., например, дату рождения нужно записывать одинаково для каждого студента и она должна иметь одинаковую длину и определенное место среди остальной информации. Эти же замечания справедливы и для остальных данных (номер личного дела, фамилия, имя, отчество).
Пользователями базы данных могут быть различные прикладные программы, программные комплексы, а также специалисты предметной области, выступающие в роли потребителей или источников данных. Их называют конечными пользователями.
В современной технологии баз данных предполагается, что создание базы данных, ее поддержка и обеспечение доступа пользователей к ней осуществляются централизованно с помощью специального программного инструментария – системы управлении базами данных (СУБД).
База данных (БД) – поименованная совокупность данных, отражающая состояние объектов и их отношений в некоторой предметной области.
Объект БД – элемент предметной области, информацию о котором мы сохраняем.
Объект может быть реальным (например, человек, изделие или населенный пункт) и абстрактным (например, событие, счет покупателя или изучаемый студентами курс). Так, в области продажи автомобилей примерами объектов могут служить МОДЕЛЬ АВТОМОБИЛЯ, КЛИЕНТ или СЧЕТ. На товарном складе – это ПОСТАВЩИК, ТОВАР, ОТПРАВЛЕНИЕ и т. д.
Система управления базами данных – комплекс программных и языковых средств, предназначенных для создания, ведения и совместного применения баз данных многими пользователями.
Централизованный характер управления данными в базе данных предполагает необходимость существования некоторого лица (группы лиц), на которое возлагаются функции администрирования данными, хранимыми в базе.
Классификация баз данных
По технологии обработки данных базы данных подразделяются на централизованные и распределенные.
По способу доступа к данным базы данных разделяются на базы данных с локальным доступом и базы данных с удаленным (сетевым) доступом.
Централизованная база данныххранится в памяти одной вычислительной системы. Если эта вычислительная система является компонентом сети ЭВМ, возможен распределенный доступ к такой базе. Такой способ использования баз данных часто применяют в локальных сетях.
Распределенная база данныхсостоит из нескольких, возможно пересекающихся или даже дублирующих друг друга частей, хранимых в различных ЭВМ вычислительной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД).
Базы данных с локальным доступом:
– доступ на одном или с одного компьютера;
– простота управления и администрирования;
– простая система защиты данных.
Системы централизованных баз данных с сетевым доступом предполагают различные архитектурыподобных систем:
– файл-сервер;
– клиент-сервер.
Файл-сервер.Архитектура систем БД с сетевым доступом предполагает выделение одной из машин сети в качестве центральной (сервер файлов). На такой машине хранится совместно используемая централизованная БД. Все другие машины сети выполняют функции рабочих станций, с помощью которых поддерживается доступ пользовательской системы к централизованной базе данных. Файлы базы данных в соответствии с пользовательскими запросами передаются на рабочие станции, где в основном и производится обработка. При большой интенсивности доступа к одним и тем же данным производительность информационной системы падает. Пользователи могут создавать также на рабочих станциях локальные БД, которые используются ими монопольно. Концепция «файл-сервер» условно отображена на текущем слайде.
Клиент-сервер.В этой концепции подразумевается, что помимо хранения централизованной базы данных центральная машина (сервер базы данных) должна обеспечивать выполнение основного объема обработки данных. Запрос на данные, выдаваемый клиентом (рабочей станцией), порождает поиск и извлечение данных на сервере. Извлеченные данные (но не файлы) транспортируются по сети от сервера к клиенту. Спецификой архитектуры клиент-сервер является использование языка запросов SQL. Концепция клиент-сервер условно изображена на слайде.