Многомерная модель
Многомерная модель означает многомерное логическое представление структуры информации, а не многомерность визуализации данных.
Многомерная модель предназначена для аналитической обработки информации.
В данной модели используются такие понятия, как агрегируемость, историчность, прогнозируемость данных.
Агрегируемость данных означает возможность их рассмотрения с различным уровнем обобщения.
Историчность обеспечивает высокий уровень статичности (неизменяемости) данных и их взаимосвязей, а также в обязательном порядке привязку данных к временным точкам.
Прогнозируемость данных подразумевает задание функций прогнозирования и применение их к различным интервалам времени.
Представление данных о продажах автомобилей дилером фирмы Опель по реляционной и многомерной моделям:
Марка автомобиля | Месяц | Объем продаж |
Опель-Астра | Январь | |
Опель-Астра | Февраль | |
Опель-Астра | Март | |
Опель-Вектра | Январь | |
Опель-Вектра | Февраль | |
Опель-Омега | Февраль |
а) реляционная модель
Марка автомобиля | Январь | Февраль | Март |
Опель-Астра | |||
Опель-Вектра | |||
Опель-Омега |
б) многомерная модель
Основные понятия в многомерной моделия – измерение и ячейка.
Измерение – это множество однотипных данных, образующих одну из граней многомерного гиперкуба. Примеры наиболее часто используемых временных измерений – дни, месяцы, кварталы и годы. В качестве географических измерений широко употребляются города, районы, регионы и страны.
Ячейка – это поле, значение которого однозначно определяется фиксированным набором измерений. В примере значение ячейки объема продаж однозначно определяется комбинацией временного измерения Месяц и Марка автомобиля.
Многомерную модель, отображающую объемы продаж автомобилей менеджерами по годам, можно представить в виде трехмерного куба:
В многомерной модели данных используется два варианта организации данных – гиперкубическая и поликубическая.
В гиперкубической все кубы определяются одним и тем же набором измерений (максимально возможным). В некоторых случаях информация может быть избыточной, так как требуется обязательное заполнение ячеек.
В поликубической определяются несколько гиперкубов с различной размерностью и различными измерениями в качестве граней.
Для извлечения данных из базы, организованной по многомерной модели, применяется ряд специальных операций: срез, вращение, агрегация и детализация.
Срез представляет собой данные, полученные в результате фиксации одного или нескольких измерений. Н-р, если сделать срез в базе, организованной по трехмерной модели, по марке автомобиля Опель-Астра, то получим двухмерную таблицу продаж этой марки различными менеджерами по годам.
Операция вращение применяется в основном при двухмерном представлении данных. Для многомерного случая операция вращения представляет собой процедуру изменения порядка следования измерений.
Операции агрегациии детализации означают соответственно переход к более или менее детальному представлению информации из гиперкуба.
Достоинством многомерной модели – удобство и эффективность аналитической обработки больших объемов данных, связанных с временными интервалами. При организации таких же данных по реляционной модели происходит рост трудоемкости операций выборки и существенное увеличение затрат памяти компьютера на хранение данных.
Недостаток – громоздкость для простейших задач оперативной обработки информации.
Исследования в области моделей данных продолжаются.