Технологии оперативного анализа данных (OLAP-технологии).
Информационные хранилища и
Современные системы поддержки принятия решений и информационные системы руководителей основаны на применении специализированных информационных хранилищ и технологий оперативного анализа данных (OLAP-технологий).
Информационные хранилища представляют собой базу обобщенной информации, формируемую из множества внешних и внутренних источников, на основе которой выполняются статистические группировки и интеллектуальный анализ данных.
По сравнению с базами данных для оперативной обработки транзакций информационные хранилища обеспечивают более гибкое и простое формирование произвольных справочно-аналитических запросов, а также применение специализированных методов статистического и интеллектуального анализа данных.
В основе информационного хранилища лежит понятие многомерного информационного пространства или гиперкуба ( см. Рис. 1 ), в ячейках которого хранятся анализируемые числовые показатели ( например, объемы оборота, издержки, доходы, инвестируемый капитал и др.).
Рис.1 Пример трехмерного гиперкуба.
Измерениями (осями) гиперкуба являются признаки анализа (например, регион, тип клиента, время, группа продуктов, тип процесса). При хранении признаки анализа отделяются от фактических данных, образуя так называемую инвертированную организацию хранения данных или структуру данных типа «звезда» (см. Рис. 2 ).
Рис. 2
К особенностям хранимой информации в информационных хранилищах относятся:
· интеграция или обобщение данных в информационных хранилищах из транзакционных баз данных по всем бизнес-процессам и структурным подразделениям предприятия в виде единого многомерного информационного пространства. Например, организуется хранение показателей объемов производства, сбыта в продуктовом, отраслевом, временном и других разрезах;
· произвольность агрегации данных на основе отделения от фактических данных независимых и равноправных измерений информационного пространства (признаков анализа информации, разрезов) в виде иерархии агрегации. Например, региональный признак анализа представляется в виде иерархии агрегации: «область - район - город - село), временной признак ( год - квартал - месяц - день) и т.д.;
· обязательное хранение временного признака в данных, дающего возможность отслеживать динамику изменения показателей в течение длительного периода времени;
· обязательное хранение временного признака в данных, дающего возможность отслеживать динамику изменения показателей в течение длительного периода времени;
· обеспечение множества представлений структуры информационного хранилища для различных категорий пользователей.
С технологической точки зрения к архитектуре информационных хранилищ предъявляются общие требования:
· единообразно определенная структура многомерных данных с равноправными измерениями информационного пространства;
· поддержка многопользовательского режима оперативного анализа в среде «клиент-сервер»;
· легкая адаптация к новым информационным потребностям путем добавления новых показателей и измерений;
· автоматическое обновление информации из оперативных баз данных;
· выполнение запросов без ограничений на количество измерений и уровней их агрегации примерно с одинаковым временем реакции на запрос;
· удобный интерфейс пользователя.
Архитектура информационного хранилища приведена на рис.
Рис. Архитектура информационного хранилища