Тема 7.1. Основные сведения о технологиях баз данных

 

Рыночные отношения предъявляют повышенные требования к своевременности, достоверности и полноте информации, без которой немыслима эффективная маркетинговая, финансово-кредитная, инвестиционная деятельность.

Роль информации в обществе меняется, приобретая определяющий характер, превращая информационный продукт в товар.

В широком смысле информация определяется, как сведения об объектах реального мира и процессах происходящих с ними. Важными свойствами информации являются:

Достоверность и полнота; Ценность и актуальность; Ясность и понятность. Таким образом: информация не должна искажать истинное положение дел, иначе она приводит к принятию неправильных решений, быть актуальной в постоянно изменяющихся условиях, и представлена на языке понятном пользователя этой информацией. .

· Для достоверной, своевременной и значимой информации необходимы точные данные.

· Основной источник информации – неструктурированные данные, это «сырье». Информация структурируется путем обработки сырьевых сведений.

· Получение достоверной и своевременной информации – это ключ решению задачи,

· выработка верных решений – это ключ к успешному ведению бизнеса на мировом рынке

Такие данные должны создаваться и храниться должным образом, в формате, обеспечивающем простоту доступа и обработки. Поскольку данные – это важный базовый ресурс, ими необходимо правильно управлять.

Управление данными – это дисциплина, которая изучает методы создания, хранения и извлечения данных. Управление данными является основой любой управленческой деятельности (предприятий, правительственных органов, сферы услуг, благотворительных организаций). Как правило, эффективное управление данными предполагает использование компьютерных баз данных.

База данных – это интегрированная компьютерная структура совместного доступа, в которой размещаются: данные и метаданные.

Данные отражают сферу интересов конечного пользователя; метаданные–это данные о данных, с помощью которых осуществляется интегрирование(объединение) данных.

Метаданныеописывают свойства данных и совокупность отношений, которыми связаны данные, хранящиеся в БД.

Базы данных являются одним из основных компонентов совре­менных информационных систем.

Информационная система- это взаимосвязанная совокупность средств, методов и персонала, ис­пользуемых для хранения, обработки и выдачи информации для предметной области.

Цель любой информационной системы - обработка информа­ции конкретной предметной области.

Под предметной областью -это любой объект реального мира(понимаются связанные между со­бой функции, задачи управления в некоторой области деятельности предприятия, с помощью которых достигается выполнение постав­ленной цели).

База данных (БД)- это совокупность сведений об объектах ка­кой-либо предметной области. Данные в базе данных должны быть структурированы. Структурирование данных - это введение соглашений о способах представления данных.

Таким образом, база данных - это поименованная совокупность структурированных данных, относящихся к определенной предмет­ной области.

Особенностями базы данных являются:

• большие объемы информации;

• максимально возможная компактность хранения данных;

• возможность извлечения разнообразной информации в опре­деленной предметной области;

• удобные для пользователя вид и форма извлекаемой информации;

• высокая скорость доступа к данным;

• надежность хранения информации и возможность предостав­ления санкционированного доступа к данным для отдельных пользо­вателей;

• удобство и простота конструирования пользователем запро­сов, форм и отчетов для выборки данных.

Информационный объект – это описание некоторой сущности предметной области (явления, реального объекта, процесса) в виде совокупности логически связанных реквизитов. Понятие предметной области одно из базовых понятий информатики не имеет точного определения

Создание базы данных, ее поддержка и обеспечение доступа пользователей к ней осуществляются с помощью специального про­граммного инструмента - системы управления базами данных (СУБД).

В контексте обработки данных для конкретной предметной области средствами вычислительной техники, база данных -это организованная на машинном носителе совокупность взаимосвязанных структурированных данных, содержащая сведения о различных сущностях для одной предметной области.

Чтобы компьютер мог эффективно обрабатывать информацию можно использовать один из двух общих подходов:

- 1-подход – ввести соглашение о структуре информации, т.е. обрабатывать структурированные данные, для упрощения работы

- 2 подход – работать с информацией произвольной структуры, т. с неструктурированными данными, что влечет сложные алгоритмы обработки.

Среда систем базы данных.Термин система базы данныхотносится к организации компонентов, определяющих и регулирующих сбор, хранение, управление и использования данных в среде базы данных.

Структуры и состав системы базы данных (информационной системы).Структура включает следующие компоненты: функциональные; системы обработки данных (СОД); организационные компоненты.

Функциональные компоненты - система функций управления, т.е. комплекс работ по управлению для достижения поставленной цели.

Компоненты системы обработки данных (СОД) - включают: сбор, регистрация информации на машине носители; ввод информации; создание и ведение информационной базы; обработка; вывод информации в виде распечаток, сигналов для прямого управления технологическими процессами и т. д.; организация управления вычислительным процессом в сетях локальных и глобальных.

СОД могут работать в трех основных решениях: пакетном; интерактивном; реальном масштабе времени,

Пакетный режим - результат выдается пользователю после выполнения пакетов заданий. Например: системы статистической отчетности, расчетно-кассовых центров, банков и т.д.

Интерактивный режим (диалоговый) - происходит обмен сообщениями между пользователями и системой по запросам. В результате выданной информации вводят данные для дальнейшей обработки, либо новый запрос.

Режим реального времени для управления быстропротекающими процессами, например, передали и обработкой банковской информации в глобальных международных сетях типа SWIFT, непрерывных технологических процессах.

СОД включает следующие составные части:

1) Информационное обеспечение (ИО) - это совокупность методов и средств по размещению и организации информации, которые включают: системы классификации и кодирования, унифицированные системы документации, методов создания информационной базы. От качества разработанного информационного обеспечения зависит достоверность и качество решения поставленной задачи.

2) Программное обеспечение - совокупность программных средств. В состав программного обеспечения (ПО) входят: базовые (общесистемные), прикладные (специальные), и программные продукты.

в) Базовые программные – программы для обслуживание работоспособности системы.

г) Прикладные - для автоматизации решения задач Информационной системы. Они могут быть, как универсальные, например: электронные таблицы, системы управления базами данных (СУБД) так и специализированные, разработанные специально для решения конкретной задачи.

3)Техническое обеспечение - комплекс технических средств, т.е. ПК + периферийные технические средства для сбора, регистрации первичной обработки информации, оргтехники различного назначения, телекоммуникации и связи различных классов.

4)Правовое обеспечение - совокупность правовых норм, регламентирующих создание и функционирование Информационной системы, т.е. порядок разрешения споров по достоверности информации, предание юридической силы документов.

5) Лингвистическое обеспечение - совокупность языковых средств, применяемых на стадии создания и эксплуатации СОД для повышения эффективности общения человека с ЭВМ.

6) Организационные компоненты – устанавливают значимость человеческого фактора и включают: штатное расписание, структуру подразделений, должностные характеристики персонала, системные программисты, проектировщики, программисты, конечные пользователи и т. д.

Документы являются основным носителям информации.

Документы условно-постоянной информации это:

· справочники,

· номенклатурные ценники, это таблица номенклатуры объекта (предприятия, единиц измерения, цены на товар).

· договоры поставщика с заказчиком, содержат планы поставок, количественные плановые показатели выпуска деталей, готовых изделий.

Документы учетной информации содержат данные о выполнении, например, приходно-расходные документы, карточки складского учета, ведомости.

Извещения об изменениях предназначены для корректировки информационной базы и поддержки ее в актуальном состоянии. Например, изменения цен, тарифов, номенклатуры изделий.

Запросные документы содержат условия поиска данных и документов.

Форма документа оформляется и заполняется в установленном порядке. Форма документа отображает структуру информации, содержащуюся в документе, и определяет состав, название и размещение реквизитов входящих в документ.

Для выявления структуры информации в документе важны две части: заголовочная и содержательная.

Например, в заголовке: номер документа, дата заполнения, общие данные для всего документа. Содержательная часть содержит название реквизитов.

Экономическая информация имеет дискретный характер, то есть может быть структурирована и представлена, как совокупность отдельных структурированных единиц информации. Важнейшими видами структурных единиц информации являются :

· реквизит- это простейшая единица информации, неделимая на смысловом уровне, отражающая количественную и качественную характеристику объекта (сущности, процесса и т.п.);

· составная единица информации (СЕИ) – логически взаимосвязанная совокупность реквизитов;

Система управления базами данных (СУБД)- это комплекс программных и языковых средств, необходимых для создания баз данных, поддержки их в актуальном состоянии и организации поиска информации в них. СУБД можно классифицировать:

· По количеству пользователей можно разделить на однопользовательские (настольные) и многопользовательские.

· По технологии обработки базы данных делятся на централизо­ванные и распределенные.

Централизованная база данных хранится в памяти одной ма­шины или сайте.

Распределенная база данных состоит из нескольких частей, хранимых на нескольких машинах вычислительной сети или нескольких сайтах. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных - СУРБД.

Централизованные базы данных по способу доступа делятся на:

- базы данных с локальным доступом (данные и процедуры их обработки хранятся на одной машине);

- базы данных с удаленным (сетевым) доступом.

СУБД с удаленным доступом могут быть построены с использованием архитектур файл-сервер и клиент-сервер. Архитектура файл-сервер. Принцип организации: одна машина выделена в качестве цен­тральной (сервер файлов), на ней хранится централизованная БД. Ос­тальные машины сети выполняют функции рабочих станций. Файлы базы данных в соответствии с пользовательскими запросами рабочих станций передаются на эти станции и обрабатываются на них. Про­изводительность такой системы падает, если требуется интенсивный одновременный доступ к одним и тем же данным.

Архитектура клиент-сервер. Принцип организации: центральная машина (сервер базы дан­ных) хранит централизованную БД и процедуры обработки. Клиент посылает запрос, он обрабатывается сервером, и данные, полученные по запросу, передаются клиенту.

Классификация СУБД по способу применения и сфере использования базы данных является самым распространенным и общепризнанным способом:

· СУБД, которые управляют работой баз данных, спроектированных для транзакций "немедленного отклика", называются транзакционными (Transactional DBMS) или рабочими СУБД (production DBMS). Например, транзакции по продаже товаров или услуг, закупка, платежи,представляют каждодневные операции. Время на проведения таких операций ограничено, а результат должен вступить в силу немедленно.

· база данных поддержки решений (decision support database) предна­значена в основном для получения необходимой информации при выработке стра­тегических или тактических решений на уровне среднего и высшего руководства предприятия. Поддержка решений, обеспечиваемая системой поддержки решений (decision support system, DSS), как правило, требует широкомасштабной обработки данных (манипулирования данными) для извлечения полезной информации из дан­ных, полученных за некоторый длительный промежуток времени, с тем, чтобы при­нять верное решение по ценовой политике, спрогнозировать сбыт, состояние рынка и т.п. Для обозначения баз данных , предназначенных для систем DSS, используется термин хранилище данных или банками данных.

Хранилища данных (ХД –data warehouse) является местом складирования данных и информационным источником для решения задач, анализа и принятия решений. ХД управляет данными, сохраненными из операционных систем организации (OLTP-системы).

Информационные технологии складирования данных была окончательно сформулирована Б.Инмоном ы 90-х годах 20-го века, как метод решения информационно-аналитических задач в области принятия и поддержки решений.

Концепция БД , как метод представления и накопления данных в электронном виде , сформироваласьв середине 60-тых годов прошлого века в фирме IBM.

Проектирование БАЗЫ ДАННЫХ.Важным аспектом реляционной "революции" стала идея отделения логической структуры и манипуляции данными, как они понимаются каждым пользователем, от физического представления, требуемого компьютерным оборудованием.

Различие между логическим и физическим представлением данных официально призвано в 1978 году, когда комитет ANSI/SPARC (ANSI –национальный институт стандартизации в США; SPARC – комитет по планированию стандартов и технических условий) предлагал обобщенную структуру систем базы данных ( TSICHRIZIS and KLUG, 1978).

Эта структура получила название трехуровневой архитектуры: три уровня абстракции, на которых можно рассматривать базу данных. Три уровня - концептуальный, внешний и внутренний. В настоящее время пришли к выводу, что надо расширить классификацию моделей данных, добавив еще один уровень абстракции – физический , т. е. физическую модель данных.

Концептуальный уровень - концептуальное проектирование базы данных, которое включает анализ информационных потребностей пользователя и определения нужных им элементов данных. Результатом является концептуальная схема (концептуальная модель) для описания всех элементов данных и отношение между ними.

Концептуальный уровень - структурный уровень базы данных, определяющий логическую схему базы данных.

Внешний уровень - это пользовательское представление данных, т.е. описание данных и отношения между ними. Совокупность всех пользовательских представлений данных - и есть внешний уровень. Внешний уровень - это структурный уровень базы данных, определяющий пользовательские представления данных.

Внутренний уровень – это представление БД с точки зрения СУБД. Внутренняя модель требует, чтобы проектировщик привел свойства и ограничения концептуальной модели в соответствие с выбранной моделью реализации.

Физическая модель действует на самом нижнем уровне абстракции и осуществляет физический взгляд на базу данных (дисководы, физические адреса, индексы, указатели и т. д.).

 


.

 

 

Рис. 10 Трехуровневая архитектура базы данных, в соответствии со стандартом ANSI/SPARC.

 

Концептуальная модель отражает структуру и связи внутри БД. Бд является интегрированной совокупности недублированных данных, на основе которых решаются задачи данной предметной области.

Модель данных – это совокупность взаимосвязанных структур данных и операций над этими структурами. Модели БД можно подразделить на две категории: концептуальные модели и модели реализации. Модели реализации можно подразделить на иерархические, сетевые и реляционные.

Концептуальная модель отражает логические структуру и связи внутри БД. Концептуальная модель проецируется на один из типов моделей реализации данных. Выбор СУБД зависит от выбранного типа модели реализации, технических средств и сложностью решаемых задач.

Концептуальное проектирование базы данных - определение элементов данных, отношений между ними и ограничений.

Ограничение значений - правило, определяющее допустимые значения.

В основу проектирования БД должны быть положены представления конечных пользователей конкретной организации - концептуальные требования к системе. Данные, помещаемые в БД, тоже предоставляет конечный пользователь. В результате поставленной заказчиком задачи и обработки требований конечных пользователей составляется концептуальная модель данных.

Существуют различные подходы концептуального проектирования:

1.Объекто-ориентированный - это модель, представляющая категории реального мира в виде объектов, а не записей;

2.Семантическое моделирование - модель, отражающая значение реальных категорий и отношений.

Семантическое моделирование представляет собой моделирование структуры данных, опираясь на смысл этих данных. В качестве инструмента семантического моделирования используются различные варианты диаграмм сущность-связь (ER – Entity-Relationship).Первый вариант модели сущность-связь был предложен в 1976 г. Питером Пин-Шэн Ченом. В дальнейшем многими авторами были разработаны свои варианты подобных моделей (нотация Мартина, нотация IDEF1X, нотация Баркера и др.). Кроме того, различные программные средства, реализующие одну и ту же нотацию, могут отличаться своими возможностями. По сути, все варианты диаграмм сущность-связь исходят из одной идеи - рисунок всегда нагляднее текстового описания. Все такие диаграммы используют графическое изображение сущностей предметной области, их свойств (атрибутов), и взаимосвязей между сущностями.

При разработке ЕR-моделей мы должны получить следующую информацию о предметной области:

1. Список сущностей предметной области.

2. Список атрибутов сущностей.

3. Описание взаимосвязей между сущностями.

Физическое проектирование - определение средств хранения, методов извлечения и индексов, используемых в базе данных.

Поддержка базы данных - логические и физические структуры базы данных, т.е. изменение потребностей пользователя, объема информации. Новые возможности оборудования приводят к корректированию логической и физической структуры базы данных.

Модели реализации.

Уровень1

Иерархическая модель представляет совокупность связанных элементов, образующих иерархическую структуру. Связанные объекты образуют перевернутый граф. Основные элементы иерархической модели - уровень, узел и связь.

 

Узел - совокупность атрибутов, описывающих объект. Каждый узел связан с узлом другого уровня. Наивысший в иерархии узел называется корневым (это главный тип объекта). Корневой узел находится на первом уровне. Зависимые узлы (подчиненные типы объектов) находятся на втором, третьем и т.д. уровнях.

Сетевая модель данных имеет те же понятия и элементы, что и иерархическая модель. Существенным отличием от иерархической модели является то, что любой узел может быть связан с другим узлом, а так же с корневым. Каждый объект может участвовать в любом числе связей.

 

Связи между файлами в иерархических и сетевых моделях определяются при описании структуры БД и физически передаются при помощи различных указателей.