Системы управления базами данных: общая характеристика

Словарь терминов

Омск-2006

Конспект лекций

Системы управления базами данных

И.И. Семенова

 

 


Business Intelligence– термин, обозначающий класс приложений для сбора, обра­ботки и всестороннего анализа данных из различных источников. Также данный термин подразумевает сам процесс извлечения информации из данных и пре­доставления ее в удобном виде для менеджеров верхнего звена с целью помочь в принятии решений.

CRUD (Create, Read, Update и Delete)– в отношении базы данных эта аббревиатура соответствует следующим командам SQL: INSERT, SELECT, UPDATE и DELETE. Означает набор элементарных операций, доступных для выполнения над базой данных.

DBA– см. Администратор базы данных.

HOLAP, Hybrid OLAP– технологии OLAP, основанные на многомерном представлении содержимого баз данных различных типов.

MOLAP, Multi-Level OLAP– технологии OLAP, в которых источниками данных служат многомерные базы данных.

ODBC, Open Database Connectivity– распространенный стандарт, поддер­живаемый приложениями, которые взаимодействуют с базами данных. Стандарт поддерживается в продуктах компаний Microsoft, Oracle, Sybase и др. ODBC включает в свой состав семейство языков SQL для манипулирования объектами базы данных.

ROLAP, Relational OLAP– технологии OLAP, использующие представле­ние данных в виде куба. Понятие кубов поддерживается над реляционной базой данных.

Select– запрос, результатом которого является вывод строк, удовлетворяю­щих заданным условиям.

SQL, Structured Query Language (Язык структурированных запросов)– язык программирования, который позволяет реализовать пользовательский интерфейс с реляционными базами данных. SQL – стандарт де факто для соз­дания приложений реляционных баз данных. Он также может присутствовать в программном коде в качестве вставок, что позволяет вызывать команды SQL из других языков (например, C++ или Delphi).

Авторизационный запрос (authorization request)– запрос, инициируемый клиентом для получения доступа к данным, к которым он не имел доступа ранее.

Агент (emissary)– обобщающий термин для программных компонентов, которые используются для взаимодействия с внешними источниками данных в соответствии с потребностями определенного приложения. Агент позволяет не только транслировать запрос во внешнюю систему на получение данных, но и конвертировать данные.

Агент сервиса (service agent)– программное обеспечение, позволяющее вы­полнять обмен информацией с внешними сервисами системы.

Администратор базы данных (database administrator, DBA)– специалист, от­ветственный за разработку, поддержку и безопасность баз данных на предприятии.

Администрирование данных (data administration)– функция управления данными, которая подразумевает сбор и поддержание в актуальном состоянии данных справочников предприятия. Функции управления данными также подра­зумевают анализ производительности баз данных предприятия с целью выработ­ки стандартов использования данных и безопасности.

Анализ запроса (query resolution)– процесс сбора данных, которые необхо­димы для выполнения запроса.

Аналитический тип базы данных (analytical type of database)– база данных, содержащая данные из оперативной и внешней баз данных. Аналитическая база данных используется для передачи данных в аналитические системы, системы поддержки принятия решений и другие информационные системы.

Архитектура хранилища данных (data warehouse architecture)– интегрированный набор программных продуктов, позволяющий извлекать и преобразо­вывать оперативные данные с целью их дальнейшей загрузки в базу данных для последующего анализа и формирования отчетов для конечных пользователей.

Атомарная транзакция (atomic transaction)– транзакция, в которой либо все этапы выполняются, либо не выполняется ни один. Атомарная транзакция обычно используется для изменения данных в базе данных.

Атомарные данные (atomic data)– элементы данных, которые представляют собой низший уровень детализации набора данных.

Атрибут (attribute)– используется для описания набора взаимосвязанных величин. Обычно представляет собой набор колонок, содержащих разнородную информацию.

База данных, БД (database)

1. Набор всех необходимых данных, которые помогают отдельному пользова­телю или целой организации выполнять определенные функции.

2. Набор связанных файлов.

3. Любой набор данных, являющийся результатом выполнения запроса.

4. Система управления хранилищем.

База данных конечного пользователя (end user type of database)– база дан­ных, содержащая набор данных, которые были заранее извлечены из различных баз данных предприятий и приведены к единому общему виду.

База данных локального доступа (Local Access Database, LAD)– база дан­ных, обслуживающая отдельные системы и рабочие группы. Подобные базы дан­ных являются «розничными торговым точками» в сети хранилища данных. Они обеспечивают прямой доступ к данным, необходимым конкретным настольным системам или службам запросов. Данные попадают в LAD из хранилищ данных согласно определенным условиям.

Базовые таблицы (base tables)– нормированные структуры данных, обраба­тываемые в таблице-приемнике. Также для обозначения данного понятия исполь­зуется термин «детальные данные» (detail data).

Базовый запрос (base query)– см. Поверхностный запрос.

Библиотека MFC (Microsoft Foundation Class Library)– набор классов, поддерживаемый компанией Microsoft. MFC имеет иерархическую структуру и рас­считана на использование в среде программирования Visual C++. MFC включает в себя среду разработки для создания приложений, на основе которой про­граммисты могут легко создавать приложения, использующие низкоуровневые функции операционной системы семейства Windows.

Библиотека классов (class library)– набор связанных классов, которые соб­раны в виде иерархической структуры. Иерархия строится путем соблюдения родственных отношений между классами (наследуемый класс – класс-родитель). Существует несколько стандартных библиотек классов, разрабатываемых крупны­ми производителями сред для программирования. Например, ярким представи­телем подобных библиотек может служить библиотека MFC.

Блокировка (locking)– метод «замораживания» базы данных, связи, кортежа или набора данных во время доступа к нему одного из пользователей. Блокиров­ка позволяет обеспечить сохранность данных в то время, когда они изменяются одним пользователем. Во время блокировки другой пользователь не сможет из­менить данные.

Блокировка при записи (write lock)– блокировка строки таблицы, в кото­рую выполняется запись данных. Позволяет избежать потери данных при записи в таблицу данных разными пользователями. См. также Блокировка.

Быстрая загрузка (fastload)– технология, заменяющая специальную функ­цию загрузки в СУБД. Характеризуется значительно более коротким време­нем загрузки вследствие предварительной обработки данных и обхода проверок целостности данных и записи в системный журнал.

Вторичные данные (derived data)– данные, которые являются результатом вычислительных шагов, примененных к данным о событии. Вторичные данные являются либо результатом сопоставления двух или более элементов отдельной транзакции (например, агрегация), либо результатом сопоставления одного или более элементов транзакции с каким-либо внешним алгоритмом или правилом.

Вторичные элементы (derived members)– элементы, чьи данные являются вторичными данными.

Вычисленный атрибут (computed attribute)– атрибут, значение которого вычисляется на основе других атрибутов. Иногда вычисленные атрибуты хранят­ся в виде связей и ссылок. Более часто они являются следствием выполнения ка­ких-либо операций в результате выполнения запроса к другим ячейкам таблицы.

Вычисленный элемент (calculated member)– элемент измерения, чья вели­чина определяется величинами других элементов (например, вследствие приме­нения математических или логических операций). Вычисленный элемент может представлять собой часть OLAP-сервера или быть описан пользователем в тече­ние интерактивной сессии. Вычисленный элемент – это любой элемент, значе­ние которого является не результатом ввода, а результатом вычисления.

Генератор отчетов (report generator)– функция СУБД, позволяющая ко­нечному пользователю быстро определять формат отчета для информации, кото­рая является результатом выполнения запроса к базе данных.

Главные данные (master data)– данные, которые получены в результате не­посредственного анализа сущности и внесены в заранее подготовленную для это­го таблицу (например, цена, доход предприятия, отчетный период и др.).

Данные (data)– понятие, представляющее собой набор фактов, текст, графи­ку, изображения, звуки, аналоговые или цифровые видеофрагменты. Данные – это необработанный материал системы, предоставляемый поставщиками данных и используемый потребителями информации для дальнейшего анализа.

Данные администрирования (administrative data)– в хранилище данных – данные, которые помогают администратору выполнять функции управления хранилищем. В качестве примера данных администрирования можно привести дан­ные о профилировании пользователей.

Данные конечного пользователя (end user data)

1. Данные, форматирование которых выполнено в соответствии с запросами
конечного пользователя.

2. Данные, созданные конечным пользователем.

3. Данные, которые являются результатом обработки запроса хранилищем
данных.

Данные о событии (event data)– данные о событиях бизнеса (обычно о биз­нес-транзакциях), имеющие историческое значение или необходимые для анали­за других систем. Данные о событии могут существовать в виде атомарных и аг­регированных данных.

Двунаправленная репликация (bidirectional replication)– сценарий репли­кации, в котором одновременно выполняется репликация между основной и реплицированной базой данных в обоих направлениях. См. также Основная база данных и Реплицируемая база данных.

Денормализация (denormalize)– процесс разработки базы данных, который подразумевает объединение данных из различных таблиц в одну таблицу. Денормализованные базы данных менее информативны, чем нормализованные, однако они позволяют более быстро и просто выполнять запросы и составлять отчеты. См. также Нормализация.

Децентрализованная база данных (decentralized database)– ранее централи­зованная база данных, которая затем была разделена на несколько баз в соответ­ствии с необходимостью конкретной бизнес-задачи или конечного пользователя.

Децентрализованное хранилище (decentralized warehouse)– удаленный ис­точник данных, доступ пользователей к которому организован через шлюз или прокси-сервер. После того как пользователь будет авторизован шлюзом или про­кси-сервером, ему будет разрешено выполнять различные функции в соответст­вии с его правами доступа (например, выборку данных, их индексирование или удаление).

Диаграмма потока данных (data flow diagram)– диаграмма, отображающая нормальный информационный поток между отдельными сервисами, а также ме­жду сервисами и накопителями данных

Диаграмма связей сущностей (Entity-Relation diagram, ER diagram)

1. Инструмент, используемый при разработке реляционных баз данных, с по­
мощью которого сущности представляются в виде геометрических фигур
и связей между ними. Связи представляют собой обычные линии, соеди­няющие сущности между собой.

2. В отношении баз данных диаграмма связей сущностей представляет собой
набор таблиц, между которыми установлены логические связи.

Динамическая маршрутизация данных, ДМД (dynamic data routing)– логическая схема, которая используется для определения сервера баз данных в сре­де с несколькими активными серверами баз данных при передаче данных для их модификации и сохранения. ДМД обычно используется в качестве алгоритма хеширования, таблицы правил или схемы декомпозиции.

Динамический запрос (dynamic query)– динамически созданный запрос SQL, который обычно является результатом использования различных программных средств. В подобных системах запросы не являются заготовками. Их подготовка и выполнение происходит во время работы системы в соответствии с параметра­ми работы системы или среды окружения.

Длительная транзакция (long-running transaction)– транзакция, которая вследствие своей длительности выполнения имеет набор средств для своего до­срочного прерывания. Также данная транзакция должна подразумевать набор действий, которые будут выполнены в результате досрочного прерывания выпол­нения транзакции.

Журнал транзакции (transaction log)– системный файл, в который вносится информация о ходе выполнения транзакции и ее результатах.

Запись данных (post)– метод изменения данных в базе. Запись данных мо­жет быть прямая или зависящая от состояния базы данных (например, от содер­жания определенного атрибута).

Запрос (query)

1. Команда, написанная на языке запросов, выполнение которой возвращает
набор данных из БД.

2. Набор данных, который является результатом выполнения запроса или
процедуры.

Захват изменений данных (change data capture)– процесс захвата измене­ний, произведенных в производственных источниках данных. Захват изменений данных обычно производится путем чтения журнала СУБД. Он объединяет уча­стки работы, обеспечивает синхронизацию данных с первоисточником и умень­шает объем данных в среде хранилища данных.

Значение (value)– определенные сведения (данные) о сущности.

Иерархическая структура базы данных (hierarchical database structures)– логическая структура базы данных, в которой связи между записями могут быть представлены в виде иерархической или древоподобной схемы. Связи между за­писями могут быть одного из двух типов: «один ко многим» и «один к одному».

Иерархические отношения (hierarchical relationships)– любые элементы из­мерений могут быть представлены в системе родительских отношений. Обычно это происходит, когда родительский элемент является результатом консолида­ции дочерних элементов. Следствием этого является иерархия, а родительские отношения представляются в виде иерархических отношений.

Избыточность (redundancy)– хранение множества экземпляров идентичных данных.

Индекс (index)

1. Метод, который используется для изменения порядка прохода кортежа
или отображения его содержимого в определенном порядке.

2. Структура данных, которая позволяет получить быстрый доступ к данным.
Индексы обычно используются в больших массивах данных и позволяют
ускорить процесс выборки, поиска и составления отчетов.

Инструменты формирования запроса (query tools)– приложение, позво­ляющее пользователю создавать специфические запросы к базе данных и управ­лять ими. Подобный инструмент предоставляет средства для извлечения необ­ходимой информации из базы данных. Обычно он базируется на средствах SQL и позволяет определять данные на языке конечного пользователя.

Интерфейс сервиса (service interface)– набор методов, позволяющий орга­низовать взаимодействие с сервисом. Имеет открытый интерфейс, который раз­работчики могут использовать для передачи или получения данных от сервиса.

Информационная проходка (data mining)– процесс поиска и определения

 

Data mining – это процесс «просеивания» большого объема данных для опреде­ления соотношений между ними. Также известен термин «скольжение по дан­ным» (data surfing).

Информационная система (OLAP) (information system)– приложение, ко­торое выполняет сбор данных из различных внутренних и внешних источников, а также выполняет первичный анализ данных и извлечение из нее информации.

Исходная базаданных (source database)– операционная база данных или централизованное хранилище, поставляющее данные для целевой базы данных.

Класс (class)– базовый строительный элемент объектно-ориентированного программирования. С помощью классов определяется понятие типа объектов. Для этого достаточно определить их свойства (данные), а также процедуры (методы), которые будут в дальнейшем поддерживаться выбранными типами. Классы имеют такое важное свойство, как наследование. Один класс может быть наследован от другого. Наследуемый класс имеет набор свойств и методов, ко­торые были присущи родительскому классу, однако разработчики при необходи­мости могут расширить набор свойств и методов для работы с данным классом путем добавления новых элементов класса. Классы позволяют выполнить деком­позицию сложных и комплексных программ, а следовательно, часто использу­ются для решения сложных задач, требующих привлечения большого числа программистов.

Ключевое поле (key field)

1.Одно или несколько полей внутри таблицы данных, которые позволяют
идентифицировать таблицу.

2. Логический элемент данных, не зависящий от сущности, на основе которой
выполнена запись данных.

3. Наименьшее поле с данными, которое состоит из набора символов, описы­вающих определенный атрибут или сущность.

4. Набор связанных полей данных, обращение к которому может быть выпол­нено как к единому целому. Иногда используется название «набор дан­ных» (data set).

5. Набор логически связанных записей или файлов
Компонент (component)

1. Часть какой-либо системы.

2. Модуль функциональности, который может использоваться в виде раз­
личных реализаций. Компонент обычно реализуется в виде отдельного
программного объекта, имеющего свой собственный интерфейс и логику
работы.

Конкуренция СУРБД (RDBMS concurrence)– перекрывающее, конкури­рующее выполнение сегментов кода в реляционной базе данных.

Контроль взаимосовместимости (concurrency control)– в терминах СУБД это управление одновременным доступом к базе данных. Благодаря контролю взаимосовместимости база данных защищена от одновременного редактирова­ния различными пользователями одной ячейки базы данных. Также контрольвзаимосовместимости используется во время создания расписания выполнения методов резервного копирования и восстановления данных.

Контроль избыточности (redundancy control)– управление средой рас­пределенных данных для ограничения чрезмерной стоимости дублирования, обновления и передачи, связанной с множественным копированием одних и тех же данных. Дублирование данных является стратегией контроля избыточности, направленной на улучшение работы программы.

Конфигурационные данные (configuration data)– данные, позволяющие выполнить настройку системы в целом, а также ее отдельных модулей. Конфигурационные данные отличаются в зависимости от тех задач, которые выполняет дан­ная система.

Кортеж (tuple)– набор данных об определенной сущности. Обычно пред­ставлен в таблице БД в виде отдельной строки.

Критерий (criterion, pi. criteria)– характеристика или ограничение, которое применимо к значениям атрибута. Позволяет задать границы значений данного атрибута, а также взаимосвязь между выбором данных значений.

Логическая модель данных (logical data model)– фактическая реализация концептуальной модели в базе данных. Для реализации одной концептуальной модели данных может потребоваться множество логических моделей данных.

Локатор (locator)– строковое значение, которое указывает на местоположе­ние постоянного запроса или файла протокола транзакций БД.

Машина хранилища данных (data warehouse engine)– реляционная база данных или многомерная база данных. Машина хранилища данных требует мощных средств формирования запросов, наличия механизмов быстрой загрузки и возможности хранения большого объема информации.

Менеджер базы данных (database manager)

1. Система управления базой данных.

2. Разработчик, ответственный за разработку, внедрение и поддержку приложений базы данных и самой БД.

Метаданные (metadata)– сведения о данных. Примерами метаданных могут быть описания элементов и типов данных, атрибутов и свойств, рангов и доменов, процессов и методов. Среда хранилища охватывает все корпоративные ресурсы метаданных: каталоги баз данных, словари данных и навигационные службы. Метаданные включают в себя такие параметры, как имя, длина, действительные значения и описания элементов данных. Метаданные хранятся в словарях дан­ных и хранилище. Они изолируют хранилище данных от изменений в схеме опе­рационных систем.

Многомерная база данных, МБД (multi-dimensional database, MDBS и MDBMS)– база данных, позволяющая пользователям анализировать большие объемы данных, используя многомерную структуру. База данных со специальной организацией хранения – кубами, обеспечивающая высокую скорость работы с данными, хранящимися как совокупность фактов, измерений и заранее вычис­ленных агрегатов.

Многомерные структуры баз данных (multidimensional database structures)

модель базы данных, в которой используются многомерные структуры (такие, как кубы) для хранения данных и связей между данными. Множество данных (aggregate data)

1. Данные, которые являются результатом объединения элементов данных.

2. Данные, предоставляемые в совокупности или в форме единого результата
суммирования.

Моделирование данных (data modeling)– процесс, в котором выполняется идентификация и установка связей между элементами данных с целью разработ­ки модели данных.

Модель данных (data model)– логическая структура, разрабатываемая на этапе моделирования базы данных. Представляет собой набор свойств данных, которые наследуются вне зависимости от программного и аппаратного обеспече­ния. Модель содержит элементы данных, сгруппированные в записи, а также свя­зи, которые задают взаимоотношения между записями.

Небезопасный запрос (unsafe query)– запрос, который может привести к бесконечному выполнению (или бесконечному выводу результата). Обычно встречается в рекурсивных запросах. В некоторых СУБД имеются дополнитель­ные механизмы для предотвращения выполнения подобных запросов.

Незапланированный запрос (ad-hoc query)– любой запрос, который не может быть предварительно определен к моменту своего запуска. Запрос, по­строенный на основе динамически сконструированного выражения SQL, обычно используемого в настольных средствах формирования запросов.

Непротиворечивость транзакции (transactional consistency)– условие, при соблюдении которого все транзакции в первичной базе данных применимы в реплицируемой БД в том же порядке, в котором они были выполнены в первич­ной БД.

Нормализация (normalization)– процесс уменьшения комплексной структу­ры данных до простейшей, наиболее стабильной структуры. В целом процесс вы­зывает удаление излишних атрибутов, ключей и отношений из концептуальной модели данных.

Нормальная форма (normal form)

1. Свойство связей и баз данных, которое позволяет избежать избыточности
хранения данных и увеличить производительность БД.

2. Правила и процессы для приведения связей и баз данных в нормальную
форму.

Обобщающие запросы (roll up queries)– запросы, суммирующие данные на более высоком уровне, чем предыдущий уровень детализации.

Объединение (join)– запрос, результатом которого является набор данных из различных источников (с использованием двух и более связей). Связи должны иметь как минимум один атрибут связывания, который позволяет связать данные из различных таблиц.

Оперативная аналитическая обработка (On-line Analytic Processing, OLAP)

технология аналитической обработки информации в режиме реального времени, включающая составление и динамическую публикацию отчетов и документов. Термин «OLAP» был введен в 1993 г. Е. Ф. Коддом (Е. F. Codd), сформулировав­шим основные требования к функциональности программных продуктов, реали­зующих эти технологии.

Оперативная база данных (operational database)– база данных, состоящая из справочных данных по конкретной системе и данных о событиях, относящих­ся к системе обновления транзакций. Она может также содержать контрольные данные системы, такие как индикаторы, флажки и счетчики. Рабочая база данных является источником данных для хранилища данных. Она содержит деталь­ные данные, используемые для запуска ежедневных операций бизнеса. Данные непрерывно меняются при обновлениях и отражают текущее значение последней транзакции.

Оперативная обработка транзакций (On-Line Transaction Processing, OLTP)– обработка транзакций в режиме реального времени.

Оперативные данные (OLTP) (operations data)– данные, которые сгене­рированы или получены в результате ежедневной работы системы (например, поступившие за текущий день заказы, открытые кредиты или счета за теку­щий месяц).

Оперативный склад данных (Operational Data Store, ODS)– интегриро­ванная база оперативных данных. Ее источниками являются разнородные систе­мы, а система содержит текущие или ближайшие к ним по времени данные. ODS может содержать информацию за 30-60 дней, тогда как хранилище данных обыч­но содержит информацию за годы.

Откат (rollback)– функция СУБД, позволяющая вернуть данные к тому со­стоянию, в котором они были до выполнения транзакции. Обычно используется в случае возникновения ошибки или непредвиденной ситуации при выполнении транзакции.

Открытое соединение с базой данных (ODBC)– стандарт доступа к базам данных, заимствованный компанией Microsoft у консорциума SQL Access Group.

Первичная база данных (primary database)– база данных, которая содержит публикуемые объекты (таблицы и хранимые процедуры) и является источником реплицируемых данных. См. также Реплицируемая база данных.

Первичный объект (primary object)– объект (таблица и хранимая процеду­ра) в первичной базе данных. См. также Первичная база данных.

Перемещение данных (data transfer)– процесс перевода данных из одной среды в другую. Средой может быть как прикладная система, так и операционная среда.

Планирование данных (data planning)– процесс планирования ресурсов предприятия с целью обеспечения надежного, гибкого и оперативного хранения данных. Процесс включает разработку общей политики предприятия в отноше­нии хранимых данных, а также архитектуру и ресурсы, используемые для хране­ния данных предприятия.

Поверхностный запрос (ground query)– запрос, в котором все атрибуты до­ступны через связи. Ни одно из значений атрибута не берется из внешних источ­ников данных или других запросов (подзапросов).

Подписка (subscription)– контейнер объекта, который ассоциирован с со­единением для репликации. См. также Реплицируемая база данных.

Подписывать (subscribe)– процесс выбора транзакций и идентификации реплицируемых объектов, которые должны им соответствовать. См. также Пуб­ликация.

Поле (field)– наименьший элемент таблицы, который имеет свой собствен­ный адрес. См. также Ячейка.

Политика (policy)– набор правил безопасности, операционного менеджмен­та и коммуникаций, который применяется в отдельно взятой области (например, в отдельно взятом домене компании).

Последовательный доступ к базе данных и файлу (sequential database and file access)– последовательный метод сохранения и считывания данных из БД или файла.

Постоянный запрос (persistent query)– запрос, который хранится для даль­нейшего использования (повторного использования).

Правила выполнения, основанные на событии (event-based execution rules)– процесс идентификации тех задач, которые могут быть успешно доведены до кон­ца, или системных событий, которые могут иметь место до начала обработки по­ставленной задачи.

Предметно-ориентированная база данных (subject oriented database)– вместо построения одного крупного централизованного хранилища данных мно­гие компании создают несколько предметно-ориентированных хранилищ для об­служивания потребностей различных подразделений. Такие хранилища образу­ют систему, называемую витриной данных (data mart).

Преобразование данных (data transformation)– извлечение информации из данных. Включает в себя расшифровку производственных показателей и слияние записей из различных форматов СУБД.

Проверка правильности (validation)– процесс проверки данных на выполне­ние каких-либо условий.

Программное обеспечение среднего слоя (mid-tier data warehouse)– для того чтобы быть масштабируемой, всякая конкретная реализация среды доступа к данным должна содержать в себе несколько промежуточных распределенных связей в системе хранилища данных. Эти промежуточные связи действуют в ка­честве исходных хранилищ данных для географически изолированных совместно используемых данных, необходимых в рамках определенных бизнес-функций.

Прямой доступ к базе данных и файлу (direct database and file access)– метод хранения данных (файлов), в котором каждый элемент хранения может быть охарактеризован адресом, вне зависимости от физического расположения данных. Используя данный уникальный адрес элемента, разработчики или поль­зователи могут в любой момент получить доступ к данным (файлу).

Публикация (publication)– объект, ассоциированный с первичной базой данных, который содержит набор публикуемых данных. См. также Первичная ба­за данных.

Публиковать (publish)– процесс идентификации и запуска транзакции для репликации данных из первичной базы данных. См. также Подписка.

Публикуемое поле (published field)– поле таблицы в первичной базе дан­ных, для которого выполняется репликация данных. См. также Первичная база данных, Поле.

Разбиение данных (data partitioning)– процесс логического и/или физиче­ского разбиения данных на более мелкие сегменты. Разбиение данных повышает производительность и ускоряет выполнение обработки данных, индексации и по­иска вхождений.

Распределенная база данных (distributed database)– база данных, ресурсы которой располагаются в более чем одной системе (или на различных физиче­ских дисках компьютера).

Регулятор запроса (query governor)– функция, прекращающая выполнение запроса к базе данных при превышении им заранее определенного порогового значения.

Рекурсивный запрос (recursive query)– запрос, результат выполнения кото­рого является входными параметрами для такого же запроса.

Реляционная структура базы данных (relational database structure)– логи­ческая структура БД, в которой все элементы хранятся в виде таблиц. При этом допускается установка связей (relations) между отдельными таблицами.

Репликация данных (data replication)– процесс копирования фрагмента ба­зы данных из одной среды в другую. После копирования полученные копии дан­ных будут использоваться синхронно с источником. Изменения, внесенные в ис­точник, распространяются на копии данных в других средах.

Реплицированные данные (replicated data)– данные, скопированные из ис­точника данных в одну или несколько целевых сред в соответствии с правилами дублирования. Реплицированные данные могут состоять из полных таблиц или фрагментов.

Реплицируемая база данных (replicate database)– база данных, которая по­лучает данные в результате реплицирующей транзакции. См. также Первичная база данных.

Реплицируемый объект (replicate object)– объект базы данных (таблица или хранимая процедура) в реплицируемой базе данных. См. также Реплицируе­мая база данных.

Репозиторий (repository)– среда хранения, содержащая полный набор биз­нес-метаданных. Репозиторий не только содержит расширенный набор мета­данных, но также может быть реализован на различных аппаратных платформах и системах управления базами данных (СУБД).

Сборка (assembly)– элемент приложения, созданного в .NET Framework.

Связующее программное обеспечение (middleware)

1. Уровень коммуникаций, позволяющий приложениям взаимодействовать друг с другом в рамках аппаратного обеспечения и сетевых сред.

2. Программный продукт, позволяющий приложениям, созданным на основе SQL, получать доступ к реляционным и нереляционным источникам данных.

Связь (relation)– простейший набор данных в реляционной базе данных. Обычно представлена прямоугольным массивом данных, в котором каждая стро­ка (кортеж) представляет единое вхождение данных.

Связь «многие ко многим» (many-to-many relationship)– один или более кортежей, который связан с другими кортежами с помощью ссылок. Благодаря этому атрибуты могут быть объединены с помощью простого запроса. При этом данные одного кортежа могут отображаться как отдельно, так и в составе другого запроса к кортежу, имеющему ссылку на данный.

Связь «один ко многим» (one-to-many relationship)– вид связи одного кор­тежа с другими кортежами. Это означает, что связываемый атрибут представлен несколькими вхождениями для первого кортежа, а также одним вхождением для всех остальных.

Связь «один к одному» (one-to-one relationship)– связь одного кортежа с другим посредством определения связующего атрибута. Это означает, что свя­зующий атрибут встречается не более чем один раз в обоих кортежах.

Сервис (service)– программный компонент, который может использоваться в качестве части более обширного бизнес-процесса. Сервисы поддерживают ин­терфейс, который базируется на основе сообщений. Сервис имеет методы для считывания своего собственного состояния, поэтому легко может переслать их по запросу пользователю или другому сервису.

Сетевая структура базы данных (network database structures)– логическая структура данных, позволяющая использовать механизм связи «многие ко мно­гим» между отдельными записями. Сетевая структура базы данных отличается от других способом физического хранения данных.

Синхронизация метаданных (metadata synchronization)– процесс объеди­нения, установления связей и синхронизации элементов данных с такими же или сходными свойствами из различных систем. Синхронизация метаданных соеди­няет эти отличающиеся элементы в хранилище данных между собой для упроще­ния доступа к ним.

Система управления базой данных, СУБД (Data Base Management System, DBMS)– набор программного обеспечения для сбора, хранения и быстрого до­ступа к данным предприятия. Также СУБД подразумевает набор инструментов для администрирования данных, доступа, создания отчетов о работе базы и функ­ций поддержки БД в рабочем состоянии. На основе СУБД создаются другие приложения, в которых требуется активное использование данных из различных (а иногда разнородных) источников данных. В данный момент на рынке пред­ставлены СУБД нескольких производителей, таких как Oracle, Microsoft, IBM, Sybase, Informix и др. Практически все они поддерживают реляционную модель базы данных.

Система управления реляционными базами данных, СУРБД (Relational Data Base Management System, RDBMS)– база данных, в которой хранение и доступ к данным происходят согласно связям между ними. База данных построена на ос­нове модели, разработанной Е. Ф. Коддом (Е. F. Codd). СУРБД подразумеваетопределение структуры данных, операций хранения и обработки данных. Данные и связи организованы в виде таблиц, представляющих собой наборы записей. Ка­ждая запись таблицы содержит набор одних и тех же атрибутов. Записи различ­ных таблиц могут быть связаны. Для связи используется одинаковый атрибут для каждой таблицы.

Склад данных (data store)– место для хранения неизменных данных (дан­ных, которые практически никогда не подвергаются редактированию и измене­нию). Склад данных представляет собой набор файлов данных, а также приложе­ние для управления этими файлами.

Словарь данных (data dictionary)– словарь метаданных (данных о данных), который включает описание содержания, связи с другими данными, частоту использования, местоположение, формат и др. Словари используются с целью унификации представлений данных на предприятии, ввода данных в систему, анализа и многих других задач, которые возникают перед программистами на предприятии.

Стандартный запрос (standard query)– хранимая процедура последнего выполненного запроса. Стандартный запрос может храниться на Рабочем столе как заранее записанный SQL-запрос и передаваться для выполнения в базу данных сервера в качестве динамического SQL-запроса.

Статический запрос (static query)– хранимая настраиваемая процедура, оптимизированная для доступа к конкретному хранилищу данных.

Степень детализации (granularity)– размер наименьшего элемента базы дан­ных, который может быть блокирован вне зависимости от других элементов базы данных. База данных предоставляет возможность для блокирования элементов на различных уровнях: уровне базы данных, уровне связей, уровне кортежей (групп взаимосвязанных элементов) или отдельных элементов, которые не вхо­дят в состав кортежа.

Строка (row)– используется в качестве синонима термина «кортеж». См. так­же Кортеж.

Сущность (entity)– реальный объект, данные о котором хранятся в базе дан­ных. Примером сущности может служить предприятие, работник организации, баланс и др.

Схема (schema)

1. Логическое и физическое определение элементов данных, физических характеристик и внутренних отношений внутри базы данных.

2. Логическое описание определенной связи.

Схема базы данных (database schema)– логическое и физическое определе­ние структуры базы данных.

Таблица (table)– элемент для хранения структурированных данных внутри реляционной БД.

Таблица поиска (lookup table)

1. Специальный файл данных, содержащий дополнительные атрибуты для дальнейшего хранения в виде таблицы. Таблица может содержать как внеш­ние атрибуты, так и информационные поля, описывающие ее содержимое.

2. Специальная таблица, в которой числовые значения разбиваются на кате­гории для упрощения поиска.

Таблицы суммирования (summarization tables)– таблицы, которые создаются по наиболее часто используемым измерениям для ускорения выполнения запро­сов, несмотря на то, что такая избыточность увеличивает объем данных в храни­лище. См. также Множество данных.

Транзакция (transaction)– функция выполнения изменений внутри реляци­онной базы данных. Единичная транзакция может привести к изменению данных в нескольких таблицах. На случай, если транзакция выполнится с ошибкой, в базе данных предусмотрена функция отката.

Транзитивное отношение (transitive dependency)– отношение, при котором один неключевой атрибут зависим от значения другого неключевого атрибута.

Триггер (trigger)– процедура SQL, которая выполняется во время фиксиро­вания какого-либо события на сервере БД (например, добавления записи, ее об­новления или удаления). С помощью триггера также могут выполняться храни­мые процедуры. Триггеры, так же как и хранимые процедуры, встроены в СУБД. См. также Хранимая процедура.

Управление базой данных (database administration)– функция, включающая в себя разработку и поддержку систем хранения данных на предприятии, обзор и мониторинг производительности баз данных, а также оптимизации базы дан­ных с целью обеспечения более быстрого доступа к данным и их безопасности.

Фиксация транзакции (commit)– решение выполнения процедуры внесения данных или их изменений в базу данных.

Хранилище данных (data warehouse)– отдельная база, которая создана для поддержки принятия решений. Данные передаются из различных оперативных источников и помещаются в эту базу с помощью различных сервисов и программ­ных вставок. Доступ к данным предоставляется путем создания определенных за­просов, использования программных утилит, OLAP-серверов и систем класса ERP.

Хранимая процедура (stored procedure)– программа, написанная на языке SQL, которая хранится в базе данных. Для вызова хранимой процедуры необходимо воспользоваться ее уникальным идентификатором из клиентского приложения или триггером БД. В том случае, если хранимая процедура располагается в БД, нет необходимости программно переносить ее на локальный компьютер. Доста­точно вызвать ее с помощью идентификатора. См. также Триггер.

Центральное хранилище (central warehouse)

1. База данных, содержащая данные, которые собраны из операционных сис­тем организации. Имеет структуру, удобную для анализа данных и их
дальнейшей обработки. Предназначена для поддержки принятия решений
и создания единого информационного пространства компании.

2. Способ автоматизации, охватывающий все информационные системы,
управление которыми происходит из одного места.

Частичная зависимость (partial dependency)– значение неключевых атри­бутов, которые зависят от части ключевого атрибута (обычно частичная зависи­мость наблюдается при использовании отдельного атрибута ключевого поля, сге­нерированного на основе нескольких атрибутов).

Чистка данных (data scrubbing)– процесс фильтрации, слияния, расшифров­ки и перевода исходных данных в определенные форматы с целью унификации их хранения, уменьшения занимаемого пространства, передачи третьим лицам и т. д.

Элемент данных (data element)– простейшая единица данных, которая мо­жет быть выделена и описана в словаре или хранилище данных. Элемент данных не может быть разделен на составляющие.

Язык запросов (query language)– высокоуровневый язык программирова­ния, который используется системами управления базами данных для извлече­ния информации и данных из БД.

Язык определения данных, ЯОД (Data Definition Language, DDL)– про­граммный язык, используемый системой управления базой данных. Позволяет пользователям создавать базы данных, определять типы, структуру и связи в ба­зах данных. Примером команд ЯОД могут служить: CREATE TABLE, CREATE INDEX, ALTER, DELETE и др.

Ячейка (cell)– отдельный фрагмент данных, получаемый путем выбора одно­го элемента из каждого измерения массива. К примеру, если измерениями являют­ся прибыль предприятия и время, то ячейкой такого массива будет пересечение какой-либо строки со столбцом. В данном пересечении содержится показатель прибыли предприятия на определенной момент времени (например, прибыль за январь 2005 года).


Системой управления базами (СУБД)называют программную систему, предназначенную для создания на ЭВМ общей базы данных для множества приложений, поддержание ее в активном состоянии и обеспечение эффективного доступа пользователей к содержащимся в ней данным в рамкам предоставленных им полномочий.

 

По схеме классификации программного обеспечения СУБД представляетсобой пакет прикладных программ, расширяющих возможности операционной системы по обработке баз данных.

СУБД бывают одномодельные, реализующие одну модель данных; мультимодельные, которые определяются набором типов данных. Наблюдается тенденция к расширению таких наборов типов данных, что позволяет добавлять новые типы данных и новые операции. Такие системы называются расширяемыми системами базами данных.

Для оценки СУБД используется большое число количественных и качественных параметров.

В целом, для СУБД основные характеристики это: трудоемкость освоения, легкость внедрения и использования, трудоемкость проектирования базы данных, качество технической документации и уровень сопровождения системы.

СУБД, как программный продукт характеризуют: цена, набор реализуемых ее функций, размер и число команд, объем памяти, быстродействие, минимальная конфигурация технических средств.

В паспорте СУБД должны быть отражены следующие разделы:

1. Характеристика поддерживаемой модели (или моделей для мультимодельных систем) данных.

1.1 . Класс структур данных.

1.2 . Класс операций манипулирования данными.

1.3 . Класс ограничений целостности данных.

2. Средства администратора базы данных.

2.1 . Ведение словаря-справочника данных.

2.2 . Управление представлением базы данных в среде хранения.

2.3 . Сбор и анализ статистики функционирования базы данных.

2.4 . Реорганизация (реформатизация, реструктуризация) базы данных.

2.5 . Контроль целостности и восстановление базы данных.

2.6 . Конвертирование данных и прикладных программ.

3. Средства разработки приложений.

3.1 . Средства проектирования базы данных.

3.2 . Интерфейс с языками программирования.

3.3 . Средства генерации (генератор программного кода, форм ввода/вывода, пользовательских интерфейсов).

3.4 . Генерация отчетов.

4. Средства конечного пользователя (язык запросов, интерфейс типа меню и т.п.).

5. Интерфейсы с подсистемами функционального назначения.

6. Интерфейсы с другими СУБД.

7. Средства работы в сети ЭВМ и создания распределенных баз данных.

Выбор СУБД - это многошаговый процесс и наиболее приемлемой представляется такая последовательность выбора:

общая идеология автоматизированной информационной системы;

техническая база системы;

операционная среда;

СУБД.

Для выбора СУБД применяется, наряду с другими методиками, методика подсчета баллов. При этом строится граф общего вида, каждой вершине которого приписывается вес, характеризующий качество выполнения соответствующей функции. Корню дерева будет соответствовать обобщенная оценка СУБД. Существует также экспертный метод оценки и выбора СУБД - метод ”репертуарных решеток” Дж. Келли и т. п.