Многомерная модель

Многомерная модель означает многомерное логическое представление структуры информации, а не многомерность визуализации данных.

Многомерная модель предназначена для аналитической обработки информации.

В данной модели используются такие понятия, как агрегируемость, историчность, прогнозируемость данных.

Агрегируемость данных означает возможность их рассмотрения с различным уровнем обобщения.

Историчность обеспечивает высокий уровень статичности (неизменяемости) данных и их взаимосвязей, а также в обязательном порядке привязку данных к временным точкам.

Прогнозируемость данных подразумевает задание функций прогнозирования и применение их к различным интервалам времени.

Представление данных о продажах автомобилей дилером фирмы Опель по реляционной и многомерной моделям:

Марка автомобиля Месяц Объем продаж
Опель-Астра Январь
Опель-Астра Февраль
Опель-Астра Март
Опель-Вектра Январь
Опель-Вектра Февраль
Опель-Омега Февраль

 

а) реляционная модель

Марка автомобиля Январь Февраль Март
Опель-Астра
Опель-Вектра
Опель-Омега

б) многомерная модель

Основные понятия в многомерной моделия – измерение и ячейка.

Измерение – это множество однотипных данных, образующих одну из граней многомерного гиперкуба. Примеры наиболее часто используемых временных измерений – дни, месяцы, кварталы и годы. В качестве географических измерений широко употребляются города, районы, регионы и страны.

Ячейка это поле, значение которого однозначно определяется фиксированным набором измерений. В примере значение ячейки объема продаж однозначно определяется комбинацией временного измерения Месяц и Марка автомобиля.

Многомерную модель, отображающую объемы продаж автомобилей менеджерами по годам, можно представить в виде трехмерного куба:

В многомерной модели данных используется два варианта организации данных – гиперкубическая и поликубическая.

В гиперкубической все кубы определяются одним и тем же набором измерений (максимально возможным). В некоторых случаях информация может быть избыточной, так как требуется обязательное заполнение ячеек.

В поликубической определяются несколько гиперкубов с различной размерностью и различными измерениями в качестве граней.

Для извлечения данных из базы, организованной по многомерной модели, применяется ряд специальных операций: срез, вращение, агрегация и детализация.

Срез представляет собой данные, полученные в результате фиксации одного или нескольких измерений. Н-р, если сделать срез в базе, организованной по трехмерной модели, по марке автомобиля Опель-Астра, то получим двухмерную таблицу продаж этой марки различными менеджерами по годам.

Операция вращение применяется в основном при двухмерном представлении данных. Для многомерного случая операция вращения представляет собой процедуру изменения порядка следования измерений.

Операции агрегациии детализации означают соответственно переход к более или менее детальному представлению информации из гиперкуба.

Достоинством многомерной модели – удобство и эффективность аналитической обработки больших объемов данных, связанных с временными интервалами. При организации таких же данных по реляционной модели происходит рост трудоемкости операций выборки и существенное увеличение затрат памяти компьютера на хранение данных.

Недостаток – громоздкость для простейших задач оперативной обработки информации.

Исследования в области моделей данных продолжаются.