Многомерные схемы в OLAP-системах
С концепцией многомерного анализа данных тесно связывают оперативный анализ, который выполняется средствами ОLAP-систем.
OLAP (On-Line Analytical Processing), как указывалось выше, является технологией оперативной аналитической обработки данных, которая использует методы и средства для сбора хранения, а также анализа многомерных данных в целях поддержки процессов принятия решений.
Основное назначение OLAP-систем состоит в поддержке аналитической деятельности, произвольных (часто используется термин ad-hoc) запросов пользователей-аналитиков. Целью OLAP-анализа является проверка возникающих гипотез.
У истоков технологии OLAP стоит основоположник реляционного подхода Э. Кодд, который в 1993 г. опубликовал статью под названием «OLAP для пользователей-аналитиков: каким он должен быть». В данной работе изложены основные концепции оперативной аналитической обработки и определены основные требования, которым должны удовлетворять продукты, позволяющие выполнять оперативную аналитическую обработку. В соответствии с данными требованиями OLAP-система включает в себя два основных компонента:
1) OLAP-сервер − обеспечивает хранение данных, выполнение над ними необходимых операций и формирование многомерной модели на концептуальном уровне. В настоящее время OLAP-серверы объединяет с хранилищем данных или базой данных;
2) ОLAP-клиент − представляет пользователю интерфейс к многомерной модели данных, обеспечивая его возможностью удобно манипулировать данными для выполнения задач анализа.
OLAP-серверы скрывают от конечного пользователя способ реализации многомерной модели. Они формируют гиперкуб, с которым пользователи посредством OLAP-клиента выполняют все необходимые манипуляции, анализируя данные. Между тем способ реализации очень важен, т. к. от него зависят такие характеристики, как производительность и занимаемые ресурсы. Выделяют три основных способа реализации:
1) МОLAР − многомерный (multivariate) OLAP. Для реализации многомерной модели используют многомерные БД;
2) ROLAP − реляционный (relational) OLAP. Для реализации многомерной модели используют реляционные БД;
3) НOLAP − гибридный (hybrid) OLAP. Для реализации многомерной моде ли используют и многомерные и реляционные БД.
Разновидностями OLAP-систем являются модификации DOLAP и JOLAP. В частности, DOLAP − это настольный (desktop) OLAP. DOLAP является недорогой и простой в использовании OLAP-системой, предназначенной для локального анализа и представления данных, которые загружаются из реляционной или многомерной БД на машину клиента;
Модификация JOLAP – это новая, основанная на Java коллективная OLAP-API инициатива, предназначенная для создания и управления данными и метаданными на серверах. Основным разработчиком модификации JOLAP является Нурегiоn Solutions. Другими членами группы, определяющей предложенный API, являются компании IВМ, Огасlе и др.
На основании анализа достоинств и недостатков многомерной базы данных можно выделить следующие условия, при которых их использование является эффективным:
– объем исходных данных для анализа не слишком велик (не более нескольких гигабайт), т е. уровень агрегации данных достаточно высок;
– набор информационных измерений стабилен;
– время ответа системы на нерегламентированные запросы является наиболее критичным параметром;
– требуется широкое использование сложных встроенных функций для выполнения кроссмерных вычислений над ячейками гиперкуба, в том числе необходима возможность написания пользовательских функций.
Использование реляционных БД в OLAP-системах имеет следующие достоинства:
– в большинстве случаев корпоративные хранилища данных реализуются средствами реляционных СУБД и инструменты ROLAP позволяют производить анализ непосредственно над ними. При этом размер хранилища не является таким критичным параметром как в случае МОLАР;
– в случае переменной размерности задачи, когда изменения в структуре измерений приходится вносить достаточно часто ROLAP-системы с динамическим представлением размерности являются оптимальным решением, т.к. в них такие модификации не требуют физической реорганизации БД;
– реляционные СУБД обеспечивают значительно более высокий уровень защиты данных и хорошие возможности разграничения прав доступа.
Из изложенного выше материала можно сделать ряд выводов, представленных далее.
Для анализа информации наиболее удобным способом ее представления является многомерная модель или гиперкуб, ребрами которого являются измерения. Это позволяет анализировать данные сразу по нескольким измерениям, т. е. выполнять многомерный анализ.
Измерение – это последовательность значений одного из анализируемых параметров. Измерения могут представлять собой иерархическую структуру. На пересечениях измерений находятся данные, количественно характеризующие анализируемые факты – меры.
Как было отмечено выше, над многомерной моделью гиперкубом могут выполняться операции: среза, вращения, консолидации и детализации. Многомерную модель и эти операции реализуют OLAP-системы.
ОLAP (On-line Analytical Processing) – технология оперативной аналитической обработки данных. Это класс приложений, предназначенных для сбора, хранения и анализа многомерных данных в целях поддержки принятия решений.
Для определения ОLAP-систем Е.Кодд разработал основные правила, и разбил эти правила на четыре группы: основные особенности, специальные особенности, особенности представления отчетов и управление измерениями.
В 1995 г. Пендсон и Крит на основании правил Кодда разработали тест FASMI, определив ОLАР как «Быстрый Анализ Разделяемой Многомерной Информации».
Архитектура ОLАР-системы включает в себя ОLАР-сервер и OLAP-клиент. ОLAP-cервер может быть реализован на основе многомерных БД (MOLAP), реляционных БД (ROLAP) или сочетания обеих моделей (HOLAP).
Достоинствами MOLAP являются высокая производительность и простота использования встроенных функций.
Достоинствами ROLAP являются возможность работы с существующими реляционными БД, более экономичное использование ресурсов и большая гибкость при добавлении новых измерений.
Вопросы для самоконтроля
1. Раскройте понятие многомерного анализа данных.
2. Назовите преимущества многомерной модели данных по сравнению с одномерной моделью.
3. Обозначьте особенности технологии оперативной обработки данных на основе многомерной модели.
4. Перечислите основные операции для многомерной модели данных.
5. Сформулируйте условия эффективного использования многомерной базы данных.
6. Перечислите элементы архитектуры ОLAP-систем.
7. Назовите основные функции OLAP-сервера и OLAP-клиента.
8. Дайте определение многомерных схем в OLAP-системах.
9. Укажите способы реализации многомерной модели в OLAP-системах.
10. Сравните модификации ОLAP-систем типа DOLAP и JOLAP.