Системы управления базами данных: общая характеристика
Словарь терминов
Омск-2006
Конспект лекций
Системы управления базами данных
И.И. Семенова
Business Intelligence– термин, обозначающий класс приложений для сбора, обработки и всестороннего анализа данных из различных источников. Также данный термин подразумевает сам процесс извлечения информации из данных и предоставления ее в удобном виде для менеджеров верхнего звена с целью помочь в принятии решений.
CRUD (Create, Read, Update и Delete)– в отношении базы данных эта аббревиатура соответствует следующим командам SQL: INSERT, SELECT, UPDATE и DELETE. Означает набор элементарных операций, доступных для выполнения над базой данных.
DBA– см. Администратор базы данных.
HOLAP, Hybrid OLAP– технологии OLAP, основанные на многомерном представлении содержимого баз данных различных типов.
MOLAP, Multi-Level OLAP– технологии OLAP, в которых источниками данных служат многомерные базы данных.
ODBC, Open Database Connectivity– распространенный стандарт, поддерживаемый приложениями, которые взаимодействуют с базами данных. Стандарт поддерживается в продуктах компаний Microsoft, Oracle, Sybase и др. ODBC включает в свой состав семейство языков SQL для манипулирования объектами базы данных.
ROLAP, Relational OLAP– технологии OLAP, использующие представление данных в виде куба. Понятие кубов поддерживается над реляционной базой данных.
Select– запрос, результатом которого является вывод строк, удовлетворяющих заданным условиям.
SQL, Structured Query Language (Язык структурированных запросов)– язык программирования, который позволяет реализовать пользовательский интерфейс с реляционными базами данных. SQL – стандарт де факто для создания приложений реляционных баз данных. Он также может присутствовать в программном коде в качестве вставок, что позволяет вызывать команды SQL из других языков (например, C++ или Delphi).
Авторизационный запрос (authorization request)– запрос, инициируемый клиентом для получения доступа к данным, к которым он не имел доступа ранее.
Агент (emissary)– обобщающий термин для программных компонентов, которые используются для взаимодействия с внешними источниками данных в соответствии с потребностями определенного приложения. Агент позволяет не только транслировать запрос во внешнюю систему на получение данных, но и конвертировать данные.
Агент сервиса (service agent)– программное обеспечение, позволяющее выполнять обмен информацией с внешними сервисами системы.
Администратор базы данных (database administrator, DBA)– специалист, ответственный за разработку, поддержку и безопасность баз данных на предприятии.
Администрирование данных (data administration)– функция управления данными, которая подразумевает сбор и поддержание в актуальном состоянии данных справочников предприятия. Функции управления данными также подразумевают анализ производительности баз данных предприятия с целью выработки стандартов использования данных и безопасности.
Анализ запроса (query resolution)– процесс сбора данных, которые необходимы для выполнения запроса.
Аналитический тип базы данных (analytical type of database)– база данных, содержащая данные из оперативной и внешней баз данных. Аналитическая база данных используется для передачи данных в аналитические системы, системы поддержки принятия решений и другие информационные системы.
Архитектура хранилища данных (data warehouse architecture)– интегрированный набор программных продуктов, позволяющий извлекать и преобразовывать оперативные данные с целью их дальнейшей загрузки в базу данных для последующего анализа и формирования отчетов для конечных пользователей.
Атомарная транзакция (atomic transaction)– транзакция, в которой либо все этапы выполняются, либо не выполняется ни один. Атомарная транзакция обычно используется для изменения данных в базе данных.
Атомарные данные (atomic data)– элементы данных, которые представляют собой низший уровень детализации набора данных.
Атрибут (attribute)– используется для описания набора взаимосвязанных величин. Обычно представляет собой набор колонок, содержащих разнородную информацию.
База данных, БД (database)
1. Набор всех необходимых данных, которые помогают отдельному пользователю или целой организации выполнять определенные функции.
2. Набор связанных файлов.
3. Любой набор данных, являющийся результатом выполнения запроса.
4. Система управления хранилищем.
База данных конечного пользователя (end user type of database)– база данных, содержащая набор данных, которые были заранее извлечены из различных баз данных предприятий и приведены к единому общему виду.
База данных локального доступа (Local Access Database, LAD)– база данных, обслуживающая отдельные системы и рабочие группы. Подобные базы данных являются «розничными торговым точками» в сети хранилища данных. Они обеспечивают прямой доступ к данным, необходимым конкретным настольным системам или службам запросов. Данные попадают в LAD из хранилищ данных согласно определенным условиям.
Базовые таблицы (base tables)– нормированные структуры данных, обрабатываемые в таблице-приемнике. Также для обозначения данного понятия используется термин «детальные данные» (detail data).
Базовый запрос (base query)– см. Поверхностный запрос.
Библиотека MFC (Microsoft Foundation Class Library)– набор классов, поддерживаемый компанией Microsoft. MFC имеет иерархическую структуру и рассчитана на использование в среде программирования Visual C++. MFC включает в себя среду разработки для создания приложений, на основе которой программисты могут легко создавать приложения, использующие низкоуровневые функции операционной системы семейства Windows.
Библиотека классов (class library)– набор связанных классов, которые собраны в виде иерархической структуры. Иерархия строится путем соблюдения родственных отношений между классами (наследуемый класс – класс-родитель). Существует несколько стандартных библиотек классов, разрабатываемых крупными производителями сред для программирования. Например, ярким представителем подобных библиотек может служить библиотека MFC.
Блокировка (locking)– метод «замораживания» базы данных, связи, кортежа или набора данных во время доступа к нему одного из пользователей. Блокировка позволяет обеспечить сохранность данных в то время, когда они изменяются одним пользователем. Во время блокировки другой пользователь не сможет изменить данные.
Блокировка при записи (write lock)– блокировка строки таблицы, в которую выполняется запись данных. Позволяет избежать потери данных при записи в таблицу данных разными пользователями. См. также Блокировка.
Быстрая загрузка (fastload)– технология, заменяющая специальную функцию загрузки в СУБД. Характеризуется значительно более коротким временем загрузки вследствие предварительной обработки данных и обхода проверок целостности данных и записи в системный журнал.
Вторичные данные (derived data)– данные, которые являются результатом вычислительных шагов, примененных к данным о событии. Вторичные данные являются либо результатом сопоставления двух или более элементов отдельной транзакции (например, агрегация), либо результатом сопоставления одного или более элементов транзакции с каким-либо внешним алгоритмом или правилом.
Вторичные элементы (derived members)– элементы, чьи данные являются вторичными данными.
Вычисленный атрибут (computed attribute)– атрибут, значение которого вычисляется на основе других атрибутов. Иногда вычисленные атрибуты хранятся в виде связей и ссылок. Более часто они являются следствием выполнения каких-либо операций в результате выполнения запроса к другим ячейкам таблицы.
Вычисленный элемент (calculated member)– элемент измерения, чья величина определяется величинами других элементов (например, вследствие применения математических или логических операций). Вычисленный элемент может представлять собой часть OLAP-сервера или быть описан пользователем в течение интерактивной сессии. Вычисленный элемент – это любой элемент, значение которого является не результатом ввода, а результатом вычисления.
Генератор отчетов (report generator)– функция СУБД, позволяющая конечному пользователю быстро определять формат отчета для информации, которая является результатом выполнения запроса к базе данных.
Главные данные (master data)– данные, которые получены в результате непосредственного анализа сущности и внесены в заранее подготовленную для этого таблицу (например, цена, доход предприятия, отчетный период и др.).
Данные (data)– понятие, представляющее собой набор фактов, текст, графику, изображения, звуки, аналоговые или цифровые видеофрагменты. Данные – это необработанный материал системы, предоставляемый поставщиками данных и используемый потребителями информации для дальнейшего анализа.
Данные администрирования (administrative data)– в хранилище данных – данные, которые помогают администратору выполнять функции управления хранилищем. В качестве примера данных администрирования можно привести данные о профилировании пользователей.
Данные конечного пользователя (end user data)
1. Данные, форматирование которых выполнено в соответствии с запросами
конечного пользователя.
2. Данные, созданные конечным пользователем.
3. Данные, которые являются результатом обработки запроса хранилищем
данных.
Данные о событии (event data)– данные о событиях бизнеса (обычно о бизнес-транзакциях), имеющие историческое значение или необходимые для анализа других систем. Данные о событии могут существовать в виде атомарных и агрегированных данных.
Двунаправленная репликация (bidirectional replication)– сценарий репликации, в котором одновременно выполняется репликация между основной и реплицированной базой данных в обоих направлениях. См. также Основная база данных и Реплицируемая база данных.
Денормализация (denormalize)– процесс разработки базы данных, который подразумевает объединение данных из различных таблиц в одну таблицу. Денормализованные базы данных менее информативны, чем нормализованные, однако они позволяют более быстро и просто выполнять запросы и составлять отчеты. См. также Нормализация.
Децентрализованная база данных (decentralized database)– ранее централизованная база данных, которая затем была разделена на несколько баз в соответствии с необходимостью конкретной бизнес-задачи или конечного пользователя.
Децентрализованное хранилище (decentralized warehouse)– удаленный источник данных, доступ пользователей к которому организован через шлюз или прокси-сервер. После того как пользователь будет авторизован шлюзом или прокси-сервером, ему будет разрешено выполнять различные функции в соответствии с его правами доступа (например, выборку данных, их индексирование или удаление).
Диаграмма потока данных (data flow diagram)– диаграмма, отображающая нормальный информационный поток между отдельными сервисами, а также между сервисами и накопителями данных
Диаграмма связей сущностей (Entity-Relation diagram, ER diagram)
1. Инструмент, используемый при разработке реляционных баз данных, с по
мощью которого сущности представляются в виде геометрических фигур
и связей между ними. Связи представляют собой обычные линии, соединяющие сущности между собой.
2. В отношении баз данных диаграмма связей сущностей представляет собой
набор таблиц, между которыми установлены логические связи.
Динамическая маршрутизация данных, ДМД (dynamic data routing)– логическая схема, которая используется для определения сервера баз данных в среде с несколькими активными серверами баз данных при передаче данных для их модификации и сохранения. ДМД обычно используется в качестве алгоритма хеширования, таблицы правил или схемы декомпозиции.
Динамический запрос (dynamic query)– динамически созданный запрос SQL, который обычно является результатом использования различных программных средств. В подобных системах запросы не являются заготовками. Их подготовка и выполнение происходит во время работы системы в соответствии с параметрами работы системы или среды окружения.
Длительная транзакция (long-running transaction)– транзакция, которая вследствие своей длительности выполнения имеет набор средств для своего досрочного прерывания. Также данная транзакция должна подразумевать набор действий, которые будут выполнены в результате досрочного прерывания выполнения транзакции.
Журнал транзакции (transaction log)– системный файл, в который вносится информация о ходе выполнения транзакции и ее результатах.
Запись данных (post)– метод изменения данных в базе. Запись данных может быть прямая или зависящая от состояния базы данных (например, от содержания определенного атрибута).
Запрос (query)
1. Команда, написанная на языке запросов, выполнение которой возвращает
набор данных из БД.
2. Набор данных, который является результатом выполнения запроса или
процедуры.
Захват изменений данных (change data capture)– процесс захвата изменений, произведенных в производственных источниках данных. Захват изменений данных обычно производится путем чтения журнала СУБД. Он объединяет участки работы, обеспечивает синхронизацию данных с первоисточником и уменьшает объем данных в среде хранилища данных.
Значение (value)– определенные сведения (данные) о сущности.
Иерархическая структура базы данных (hierarchical database structures)– логическая структура базы данных, в которой связи между записями могут быть представлены в виде иерархической или древоподобной схемы. Связи между записями могут быть одного из двух типов: «один ко многим» и «один к одному».
Иерархические отношения (hierarchical relationships)– любые элементы измерений могут быть представлены в системе родительских отношений. Обычно это происходит, когда родительский элемент является результатом консолидации дочерних элементов. Следствием этого является иерархия, а родительские отношения представляются в виде иерархических отношений.
Избыточность (redundancy)– хранение множества экземпляров идентичных данных.
Индекс (index)
1. Метод, который используется для изменения порядка прохода кортежа
или отображения его содержимого в определенном порядке.
2. Структура данных, которая позволяет получить быстрый доступ к данным.
Индексы обычно используются в больших массивах данных и позволяют
ускорить процесс выборки, поиска и составления отчетов.
Инструменты формирования запроса (query tools)– приложение, позволяющее пользователю создавать специфические запросы к базе данных и управлять ими. Подобный инструмент предоставляет средства для извлечения необходимой информации из базы данных. Обычно он базируется на средствах SQL и позволяет определять данные на языке конечного пользователя.
Интерфейс сервиса (service interface)– набор методов, позволяющий организовать взаимодействие с сервисом. Имеет открытый интерфейс, который разработчики могут использовать для передачи или получения данных от сервиса.
Информационная проходка (data mining)– процесс поиска и определения
Data mining – это процесс «просеивания» большого объема данных для определения соотношений между ними. Также известен термин «скольжение по данным» (data surfing).
Информационная система (OLAP) (information system)– приложение, которое выполняет сбор данных из различных внутренних и внешних источников, а также выполняет первичный анализ данных и извлечение из нее информации.
Исходная базаданных (source database)– операционная база данных или централизованное хранилище, поставляющее данные для целевой базы данных.
Класс (class)– базовый строительный элемент объектно-ориентированного программирования. С помощью классов определяется понятие типа объектов. Для этого достаточно определить их свойства (данные), а также процедуры (методы), которые будут в дальнейшем поддерживаться выбранными типами. Классы имеют такое важное свойство, как наследование. Один класс может быть наследован от другого. Наследуемый класс имеет набор свойств и методов, которые были присущи родительскому классу, однако разработчики при необходимости могут расширить набор свойств и методов для работы с данным классом путем добавления новых элементов класса. Классы позволяют выполнить декомпозицию сложных и комплексных программ, а следовательно, часто используются для решения сложных задач, требующих привлечения большого числа программистов.
Ключевое поле (key field)
1.Одно или несколько полей внутри таблицы данных, которые позволяют
идентифицировать таблицу.
2. Логический элемент данных, не зависящий от сущности, на основе которой
выполнена запись данных.
3. Наименьшее поле с данными, которое состоит из набора символов, описывающих определенный атрибут или сущность.
4. Набор связанных полей данных, обращение к которому может быть выполнено как к единому целому. Иногда используется название «набор данных» (data set).
5. Набор логически связанных записей или файлов
Компонент (component)
1. Часть какой-либо системы.
2. Модуль функциональности, который может использоваться в виде раз
личных реализаций. Компонент обычно реализуется в виде отдельного
программного объекта, имеющего свой собственный интерфейс и логику
работы.
Конкуренция СУРБД (RDBMS concurrence)– перекрывающее, конкурирующее выполнение сегментов кода в реляционной базе данных.
Контроль взаимосовместимости (concurrency control)– в терминах СУБД это управление одновременным доступом к базе данных. Благодаря контролю взаимосовместимости база данных защищена от одновременного редактирования различными пользователями одной ячейки базы данных. Также контрольвзаимосовместимости используется во время создания расписания выполнения методов резервного копирования и восстановления данных.
Контроль избыточности (redundancy control)– управление средой распределенных данных для ограничения чрезмерной стоимости дублирования, обновления и передачи, связанной с множественным копированием одних и тех же данных. Дублирование данных является стратегией контроля избыточности, направленной на улучшение работы программы.
Конфигурационные данные (configuration data)– данные, позволяющие выполнить настройку системы в целом, а также ее отдельных модулей. Конфигурационные данные отличаются в зависимости от тех задач, которые выполняет данная система.
Кортеж (tuple)– набор данных об определенной сущности. Обычно представлен в таблице БД в виде отдельной строки.
Критерий (criterion, pi. criteria)– характеристика или ограничение, которое применимо к значениям атрибута. Позволяет задать границы значений данного атрибута, а также взаимосвязь между выбором данных значений.
Логическая модель данных (logical data model)– фактическая реализация концептуальной модели в базе данных. Для реализации одной концептуальной модели данных может потребоваться множество логических моделей данных.
Локатор (locator)– строковое значение, которое указывает на местоположение постоянного запроса или файла протокола транзакций БД.
Машина хранилища данных (data warehouse engine)– реляционная база данных или многомерная база данных. Машина хранилища данных требует мощных средств формирования запросов, наличия механизмов быстрой загрузки и возможности хранения большого объема информации.
Менеджер базы данных (database manager)
1. Система управления базой данных.
2. Разработчик, ответственный за разработку, внедрение и поддержку приложений базы данных и самой БД.
Метаданные (metadata)– сведения о данных. Примерами метаданных могут быть описания элементов и типов данных, атрибутов и свойств, рангов и доменов, процессов и методов. Среда хранилища охватывает все корпоративные ресурсы метаданных: каталоги баз данных, словари данных и навигационные службы. Метаданные включают в себя такие параметры, как имя, длина, действительные значения и описания элементов данных. Метаданные хранятся в словарях данных и хранилище. Они изолируют хранилище данных от изменений в схеме операционных систем.
Многомерная база данных, МБД (multi-dimensional database, MDBS и MDBMS)– база данных, позволяющая пользователям анализировать большие объемы данных, используя многомерную структуру. База данных со специальной организацией хранения – кубами, обеспечивающая высокую скорость работы с данными, хранящимися как совокупность фактов, измерений и заранее вычисленных агрегатов.
Многомерные структуры баз данных (multidimensional database structures)–
модель базы данных, в которой используются многомерные структуры (такие, как кубы) для хранения данных и связей между данными. Множество данных (aggregate data)
1. Данные, которые являются результатом объединения элементов данных.
2. Данные, предоставляемые в совокупности или в форме единого результата
суммирования.
Моделирование данных (data modeling)– процесс, в котором выполняется идентификация и установка связей между элементами данных с целью разработки модели данных.
Модель данных (data model)– логическая структура, разрабатываемая на этапе моделирования базы данных. Представляет собой набор свойств данных, которые наследуются вне зависимости от программного и аппаратного обеспечения. Модель содержит элементы данных, сгруппированные в записи, а также связи, которые задают взаимоотношения между записями.
Небезопасный запрос (unsafe query)– запрос, который может привести к бесконечному выполнению (или бесконечному выводу результата). Обычно встречается в рекурсивных запросах. В некоторых СУБД имеются дополнительные механизмы для предотвращения выполнения подобных запросов.
Незапланированный запрос (ad-hoc query)– любой запрос, который не может быть предварительно определен к моменту своего запуска. Запрос, построенный на основе динамически сконструированного выражения SQL, обычно используемого в настольных средствах формирования запросов.
Непротиворечивость транзакции (transactional consistency)– условие, при соблюдении которого все транзакции в первичной базе данных применимы в реплицируемой БД в том же порядке, в котором они были выполнены в первичной БД.
Нормализация (normalization)– процесс уменьшения комплексной структуры данных до простейшей, наиболее стабильной структуры. В целом процесс вызывает удаление излишних атрибутов, ключей и отношений из концептуальной модели данных.
Нормальная форма (normal form)
1. Свойство связей и баз данных, которое позволяет избежать избыточности
хранения данных и увеличить производительность БД.
2. Правила и процессы для приведения связей и баз данных в нормальную
форму.
Обобщающие запросы (roll up queries)– запросы, суммирующие данные на более высоком уровне, чем предыдущий уровень детализации.
Объединение (join)– запрос, результатом которого является набор данных из различных источников (с использованием двух и более связей). Связи должны иметь как минимум один атрибут связывания, который позволяет связать данные из различных таблиц.
Оперативная аналитическая обработка (On-line Analytic Processing, OLAP)–
технология аналитической обработки информации в режиме реального времени, включающая составление и динамическую публикацию отчетов и документов. Термин «OLAP» был введен в 1993 г. Е. Ф. Коддом (Е. F. Codd), сформулировавшим основные требования к функциональности программных продуктов, реализующих эти технологии.
Оперативная база данных (operational database)– база данных, состоящая из справочных данных по конкретной системе и данных о событиях, относящихся к системе обновления транзакций. Она может также содержать контрольные данные системы, такие как индикаторы, флажки и счетчики. Рабочая база данных является источником данных для хранилища данных. Она содержит детальные данные, используемые для запуска ежедневных операций бизнеса. Данные непрерывно меняются при обновлениях и отражают текущее значение последней транзакции.
Оперативная обработка транзакций (On-Line Transaction Processing, OLTP)– обработка транзакций в режиме реального времени.
Оперативные данные (OLTP) (operations data)– данные, которые сгенерированы или получены в результате ежедневной работы системы (например, поступившие за текущий день заказы, открытые кредиты или счета за текущий месяц).
Оперативный склад данных (Operational Data Store, ODS)– интегрированная база оперативных данных. Ее источниками являются разнородные системы, а система содержит текущие или ближайшие к ним по времени данные. ODS может содержать информацию за 30-60 дней, тогда как хранилище данных обычно содержит информацию за годы.
Откат (rollback)– функция СУБД, позволяющая вернуть данные к тому состоянию, в котором они были до выполнения транзакции. Обычно используется в случае возникновения ошибки или непредвиденной ситуации при выполнении транзакции.
Открытое соединение с базой данных (ODBC)– стандарт доступа к базам данных, заимствованный компанией Microsoft у консорциума SQL Access Group.
Первичная база данных (primary database)– база данных, которая содержит публикуемые объекты (таблицы и хранимые процедуры) и является источником реплицируемых данных. См. также Реплицируемая база данных.
Первичный объект (primary object)– объект (таблица и хранимая процедура) в первичной базе данных. См. также Первичная база данных.
Перемещение данных (data transfer)– процесс перевода данных из одной среды в другую. Средой может быть как прикладная система, так и операционная среда.
Планирование данных (data planning)– процесс планирования ресурсов предприятия с целью обеспечения надежного, гибкого и оперативного хранения данных. Процесс включает разработку общей политики предприятия в отношении хранимых данных, а также архитектуру и ресурсы, используемые для хранения данных предприятия.
Поверхностный запрос (ground query)– запрос, в котором все атрибуты доступны через связи. Ни одно из значений атрибута не берется из внешних источников данных или других запросов (подзапросов).
Подписка (subscription)– контейнер объекта, который ассоциирован с соединением для репликации. См. также Реплицируемая база данных.
Подписывать (subscribe)– процесс выбора транзакций и идентификации реплицируемых объектов, которые должны им соответствовать. См. также Публикация.
Поле (field)– наименьший элемент таблицы, который имеет свой собственный адрес. См. также Ячейка.
Политика (policy)– набор правил безопасности, операционного менеджмента и коммуникаций, который применяется в отдельно взятой области (например, в отдельно взятом домене компании).
Последовательный доступ к базе данных и файлу (sequential database and file access)– последовательный метод сохранения и считывания данных из БД или файла.
Постоянный запрос (persistent query)– запрос, который хранится для дальнейшего использования (повторного использования).
Правила выполнения, основанные на событии (event-based execution rules)– процесс идентификации тех задач, которые могут быть успешно доведены до конца, или системных событий, которые могут иметь место до начала обработки поставленной задачи.
Предметно-ориентированная база данных (subject oriented database)– вместо построения одного крупного централизованного хранилища данных многие компании создают несколько предметно-ориентированных хранилищ для обслуживания потребностей различных подразделений. Такие хранилища образуют систему, называемую витриной данных (data mart).
Преобразование данных (data transformation)– извлечение информации из данных. Включает в себя расшифровку производственных показателей и слияние записей из различных форматов СУБД.
Проверка правильности (validation)– процесс проверки данных на выполнение каких-либо условий.
Программное обеспечение среднего слоя (mid-tier data warehouse)– для того чтобы быть масштабируемой, всякая конкретная реализация среды доступа к данным должна содержать в себе несколько промежуточных распределенных связей в системе хранилища данных. Эти промежуточные связи действуют в качестве исходных хранилищ данных для географически изолированных совместно используемых данных, необходимых в рамках определенных бизнес-функций.
Прямой доступ к базе данных и файлу (direct database and file access)– метод хранения данных (файлов), в котором каждый элемент хранения может быть охарактеризован адресом, вне зависимости от физического расположения данных. Используя данный уникальный адрес элемента, разработчики или пользователи могут в любой момент получить доступ к данным (файлу).
Публикация (publication)– объект, ассоциированный с первичной базой данных, который содержит набор публикуемых данных. См. также Первичная база данных.
Публиковать (publish)– процесс идентификации и запуска транзакции для репликации данных из первичной базы данных. См. также Подписка.
Публикуемое поле (published field)– поле таблицы в первичной базе данных, для которого выполняется репликация данных. См. также Первичная база данных, Поле.
Разбиение данных (data partitioning)– процесс логического и/или физического разбиения данных на более мелкие сегменты. Разбиение данных повышает производительность и ускоряет выполнение обработки данных, индексации и поиска вхождений.
Распределенная база данных (distributed database)– база данных, ресурсы которой располагаются в более чем одной системе (или на различных физических дисках компьютера).
Регулятор запроса (query governor)– функция, прекращающая выполнение запроса к базе данных при превышении им заранее определенного порогового значения.
Рекурсивный запрос (recursive query)– запрос, результат выполнения которого является входными параметрами для такого же запроса.
Реляционная структура базы данных (relational database structure)– логическая структура БД, в которой все элементы хранятся в виде таблиц. При этом допускается установка связей (relations) между отдельными таблицами.
Репликация данных (data replication)– процесс копирования фрагмента базы данных из одной среды в другую. После копирования полученные копии данных будут использоваться синхронно с источником. Изменения, внесенные в источник, распространяются на копии данных в других средах.
Реплицированные данные (replicated data)– данные, скопированные из источника данных в одну или несколько целевых сред в соответствии с правилами дублирования. Реплицированные данные могут состоять из полных таблиц или фрагментов.
Реплицируемая база данных (replicate database)– база данных, которая получает данные в результате реплицирующей транзакции. См. также Первичная база данных.
Реплицируемый объект (replicate object)– объект базы данных (таблица или хранимая процедура) в реплицируемой базе данных. См. также Реплицируемая база данных.
Репозиторий (repository)– среда хранения, содержащая полный набор бизнес-метаданных. Репозиторий не только содержит расширенный набор метаданных, но также может быть реализован на различных аппаратных платформах и системах управления базами данных (СУБД).
Сборка (assembly)– элемент приложения, созданного в .NET Framework.
Связующее программное обеспечение (middleware)
1. Уровень коммуникаций, позволяющий приложениям взаимодействовать друг с другом в рамках аппаратного обеспечения и сетевых сред.
2. Программный продукт, позволяющий приложениям, созданным на основе SQL, получать доступ к реляционным и нереляционным источникам данных.
Связь (relation)– простейший набор данных в реляционной базе данных. Обычно представлена прямоугольным массивом данных, в котором каждая строка (кортеж) представляет единое вхождение данных.
Связь «многие ко многим» (many-to-many relationship)– один или более кортежей, который связан с другими кортежами с помощью ссылок. Благодаря этому атрибуты могут быть объединены с помощью простого запроса. При этом данные одного кортежа могут отображаться как отдельно, так и в составе другого запроса к кортежу, имеющему ссылку на данный.
Связь «один ко многим» (one-to-many relationship)– вид связи одного кортежа с другими кортежами. Это означает, что связываемый атрибут представлен несколькими вхождениями для первого кортежа, а также одним вхождением для всех остальных.
Связь «один к одному» (one-to-one relationship)– связь одного кортежа с другим посредством определения связующего атрибута. Это означает, что связующий атрибут встречается не более чем один раз в обоих кортежах.
Сервис (service)– программный компонент, который может использоваться в качестве части более обширного бизнес-процесса. Сервисы поддерживают интерфейс, который базируется на основе сообщений. Сервис имеет методы для считывания своего собственного состояния, поэтому легко может переслать их по запросу пользователю или другому сервису.
Сетевая структура базы данных (network database structures)– логическая структура данных, позволяющая использовать механизм связи «многие ко многим» между отдельными записями. Сетевая структура базы данных отличается от других способом физического хранения данных.
Синхронизация метаданных (metadata synchronization)– процесс объединения, установления связей и синхронизации элементов данных с такими же или сходными свойствами из различных систем. Синхронизация метаданных соединяет эти отличающиеся элементы в хранилище данных между собой для упрощения доступа к ним.
Система управления базой данных, СУБД (Data Base Management System, DBMS)– набор программного обеспечения для сбора, хранения и быстрого доступа к данным предприятия. Также СУБД подразумевает набор инструментов для администрирования данных, доступа, создания отчетов о работе базы и функций поддержки БД в рабочем состоянии. На основе СУБД создаются другие приложения, в которых требуется активное использование данных из различных (а иногда разнородных) источников данных. В данный момент на рынке представлены СУБД нескольких производителей, таких как Oracle, Microsoft, IBM, Sybase, Informix и др. Практически все они поддерживают реляционную модель базы данных.
Система управления реляционными базами данных, СУРБД (Relational Data Base Management System, RDBMS)– база данных, в которой хранение и доступ к данным происходят согласно связям между ними. База данных построена на основе модели, разработанной Е. Ф. Коддом (Е. F. Codd). СУРБД подразумеваетопределение структуры данных, операций хранения и обработки данных. Данные и связи организованы в виде таблиц, представляющих собой наборы записей. Каждая запись таблицы содержит набор одних и тех же атрибутов. Записи различных таблиц могут быть связаны. Для связи используется одинаковый атрибут для каждой таблицы.
Склад данных (data store)– место для хранения неизменных данных (данных, которые практически никогда не подвергаются редактированию и изменению). Склад данных представляет собой набор файлов данных, а также приложение для управления этими файлами.
Словарь данных (data dictionary)– словарь метаданных (данных о данных), который включает описание содержания, связи с другими данными, частоту использования, местоположение, формат и др. Словари используются с целью унификации представлений данных на предприятии, ввода данных в систему, анализа и многих других задач, которые возникают перед программистами на предприятии.
Стандартный запрос (standard query)– хранимая процедура последнего выполненного запроса. Стандартный запрос может храниться на Рабочем столе как заранее записанный SQL-запрос и передаваться для выполнения в базу данных сервера в качестве динамического SQL-запроса.
Статический запрос (static query)– хранимая настраиваемая процедура, оптимизированная для доступа к конкретному хранилищу данных.
Степень детализации (granularity)– размер наименьшего элемента базы данных, который может быть блокирован вне зависимости от других элементов базы данных. База данных предоставляет возможность для блокирования элементов на различных уровнях: уровне базы данных, уровне связей, уровне кортежей (групп взаимосвязанных элементов) или отдельных элементов, которые не входят в состав кортежа.
Строка (row)– используется в качестве синонима термина «кортеж». См. также Кортеж.
Сущность (entity)– реальный объект, данные о котором хранятся в базе данных. Примером сущности может служить предприятие, работник организации, баланс и др.
Схема (schema)
1. Логическое и физическое определение элементов данных, физических характеристик и внутренних отношений внутри базы данных.
2. Логическое описание определенной связи.
Схема базы данных (database schema)– логическое и физическое определение структуры базы данных.
Таблица (table)– элемент для хранения структурированных данных внутри реляционной БД.
Таблица поиска (lookup table)
1. Специальный файл данных, содержащий дополнительные атрибуты для дальнейшего хранения в виде таблицы. Таблица может содержать как внешние атрибуты, так и информационные поля, описывающие ее содержимое.
2. Специальная таблица, в которой числовые значения разбиваются на категории для упрощения поиска.
Таблицы суммирования (summarization tables)– таблицы, которые создаются по наиболее часто используемым измерениям для ускорения выполнения запросов, несмотря на то, что такая избыточность увеличивает объем данных в хранилище. См. также Множество данных.
Транзакция (transaction)– функция выполнения изменений внутри реляционной базы данных. Единичная транзакция может привести к изменению данных в нескольких таблицах. На случай, если транзакция выполнится с ошибкой, в базе данных предусмотрена функция отката.
Транзитивное отношение (transitive dependency)– отношение, при котором один неключевой атрибут зависим от значения другого неключевого атрибута.
Триггер (trigger)– процедура SQL, которая выполняется во время фиксирования какого-либо события на сервере БД (например, добавления записи, ее обновления или удаления). С помощью триггера также могут выполняться хранимые процедуры. Триггеры, так же как и хранимые процедуры, встроены в СУБД. См. также Хранимая процедура.
Управление базой данных (database administration)– функция, включающая в себя разработку и поддержку систем хранения данных на предприятии, обзор и мониторинг производительности баз данных, а также оптимизации базы данных с целью обеспечения более быстрого доступа к данным и их безопасности.
Фиксация транзакции (commit)– решение выполнения процедуры внесения данных или их изменений в базу данных.
Хранилище данных (data warehouse)– отдельная база, которая создана для поддержки принятия решений. Данные передаются из различных оперативных источников и помещаются в эту базу с помощью различных сервисов и программных вставок. Доступ к данным предоставляется путем создания определенных запросов, использования программных утилит, OLAP-серверов и систем класса ERP.
Хранимая процедура (stored procedure)– программа, написанная на языке SQL, которая хранится в базе данных. Для вызова хранимой процедуры необходимо воспользоваться ее уникальным идентификатором из клиентского приложения или триггером БД. В том случае, если хранимая процедура располагается в БД, нет необходимости программно переносить ее на локальный компьютер. Достаточно вызвать ее с помощью идентификатора. См. также Триггер.
Центральное хранилище (central warehouse)
1. База данных, содержащая данные, которые собраны из операционных систем организации. Имеет структуру, удобную для анализа данных и их
дальнейшей обработки. Предназначена для поддержки принятия решений
и создания единого информационного пространства компании.
2. Способ автоматизации, охватывающий все информационные системы,
управление которыми происходит из одного места.
Частичная зависимость (partial dependency)– значение неключевых атрибутов, которые зависят от части ключевого атрибута (обычно частичная зависимость наблюдается при использовании отдельного атрибута ключевого поля, сгенерированного на основе нескольких атрибутов).
Чистка данных (data scrubbing)– процесс фильтрации, слияния, расшифровки и перевода исходных данных в определенные форматы с целью унификации их хранения, уменьшения занимаемого пространства, передачи третьим лицам и т. д.
Элемент данных (data element)– простейшая единица данных, которая может быть выделена и описана в словаре или хранилище данных. Элемент данных не может быть разделен на составляющие.
Язык запросов (query language)– высокоуровневый язык программирования, который используется системами управления базами данных для извлечения информации и данных из БД.
Язык определения данных, ЯОД (Data Definition Language, DDL)– программный язык, используемый системой управления базой данных. Позволяет пользователям создавать базы данных, определять типы, структуру и связи в базах данных. Примером команд ЯОД могут служить: CREATE TABLE, CREATE INDEX, ALTER, DELETE и др.
Ячейка (cell)– отдельный фрагмент данных, получаемый путем выбора одного элемента из каждого измерения массива. К примеру, если измерениями являются прибыль предприятия и время, то ячейкой такого массива будет пересечение какой-либо строки со столбцом. В данном пересечении содержится показатель прибыли предприятия на определенной момент времени (например, прибыль за январь 2005 года).
Системой управления базами (СУБД)называют программную систему, предназначенную для создания на ЭВМ общей базы данных для множества приложений, поддержание ее в активном состоянии и обеспечение эффективного доступа пользователей к содержащимся в ней данным в рамкам предоставленных им полномочий.
По схеме классификации программного обеспечения СУБД представляетсобой пакет прикладных программ, расширяющих возможности операционной системы по обработке баз данных.
СУБД бывают одномодельные, реализующие одну модель данных; мультимодельные, которые определяются набором типов данных. Наблюдается тенденция к расширению таких наборов типов данных, что позволяет добавлять новые типы данных и новые операции. Такие системы называются расширяемыми системами базами данных.
Для оценки СУБД используется большое число количественных и качественных параметров.
В целом, для СУБД основные характеристики это: трудоемкость освоения, легкость внедрения и использования, трудоемкость проектирования базы данных, качество технической документации и уровень сопровождения системы.
СУБД, как программный продукт характеризуют: цена, набор реализуемых ее функций, размер и число команд, объем памяти, быстродействие, минимальная конфигурация технических средств.
В паспорте СУБД должны быть отражены следующие разделы:
1. Характеристика поддерживаемой модели (или моделей для мультимодельных систем) данных.
1.1 . Класс структур данных.
1.2 . Класс операций манипулирования данными.
1.3 . Класс ограничений целостности данных.
2. Средства администратора базы данных.
2.1 . Ведение словаря-справочника данных.
2.2 . Управление представлением базы данных в среде хранения.
2.3 . Сбор и анализ статистики функционирования базы данных.
2.4 . Реорганизация (реформатизация, реструктуризация) базы данных.
2.5 . Контроль целостности и восстановление базы данных.
2.6 . Конвертирование данных и прикладных программ.
3. Средства разработки приложений.
3.1 . Средства проектирования базы данных.
3.2 . Интерфейс с языками программирования.
3.3 . Средства генерации (генератор программного кода, форм ввода/вывода, пользовательских интерфейсов).
3.4 . Генерация отчетов.
4. Средства конечного пользователя (язык запросов, интерфейс типа меню и т.п.).
5. Интерфейсы с подсистемами функционального назначения.
6. Интерфейсы с другими СУБД.
7. Средства работы в сети ЭВМ и создания распределенных баз данных.
Выбор СУБД - это многошаговый процесс и наиболее приемлемой представляется такая последовательность выбора:
общая идеология автоматизированной информационной системы;
техническая база системы;
операционная среда;
СУБД.
Для выбора СУБД применяется, наряду с другими методиками, методика подсчета баллов. При этом строится граф общего вида, каждой вершине которого приписывается вес, характеризующий качество выполнения соответствующей функции. Корню дерева будет соответствовать обобщенная оценка СУБД. Существует также экспертный метод оценки и выбора СУБД - метод ”репертуарных решеток” Дж. Келли и т. п.