Типы используемых данных

Принципы проектирования и использования многомерных БД

Многомерный подход возник практически одновременно и параллельно с реляционным, но только начиная с 1993 г., интерес к многомерным системам управления БД (МСУБД) начал приобретать всеобщий характер. Главное достоинство МСУБД состоит в том, что они узко специализированны и область их применения -интерактивная аналитическая обработка агрегированных исторических и прогнозируемых данных. Многомерный анализ (Multi-dimensional analysis) Многомерный анализ (Multi-dimensional analysis) позволяет пользователям при работе с данными достичь глубокого понимания информации, хранящейся в БД. Многомерный подход к анализу предоставляет аналитику широкие возможности моделирования данных в соответствии со сложившимся у него представлением о проблеме, снижая тем самым вероятность ошибочной интерпретации полученных результатов. Поскольку многомерная модель отображает информацию так, как большинство людей ее себе представляют, то используется интуитивная навигация по БД. Кроме того, значительно упрощаются процедуры отображения на экране необходимых аналитику подмножеств данных, представления различных срезов информации, а также процедура задания алгоритма вычислений. Более того: в силу того, что данные хранятся в многомерной БД, выполнение подобных операций характеризуется гораздо более высокой скоростью и стабильной производительностью (по сравнению с базами данных любой другой структуры). Уникальное сочетание быстродействия и простоты использования является одним из основных преимуществ многомерного анализа.
В системах анализа многомерных данных можно выделить три основных типа данных, анализ которых позволяет производить прогнозирование бизнес процессов. 3 типа данных, анализ которых позволяет производить прогнозирование бизнес процессов: Агрегированные данные Пользователя, занимающегося анализом, редко интересуют детализированные данные. Более того, чем выше уровень пользователя (руководителя, управляющего, аналитика), тем выше уровень агрегации данных, используемых им для принятия решения. Пример. Имеется фирма по продаже компьютеров. Коммерческого директора такой фирмы мало интересует вопрос: "Какого цвета компьютеры успешнее всего продает менеджер Петров: черного или серебристого?" Для него важно, какие модели, и какие цвета предпочитают в данном регионе. Его также мало интересует детализация на уровне контракта, часа или даже дня. Например, если выяснится, что Celeron серебристого цвета чаще покупают в утренние часы, этот факт скорее заинтересует психиатра, а не коммерческого аналитика. Для правильного формирования склада ему важна и необходима информация на уровне декады, месяца или даже квартала. Исторические данные Важнейшим свойством данных в аналитических задачах является их исторический характер. После того как зафиксировано, что Петров в июне 2005 г . продал 2 компьютера Celeron и 12 компьютеров Pentium, данные об этом событии становятся историческим (свершившимся) фактом. И после того, как информация об этом факте получена, верифицирована и заведена в БД, она может быть сколько угодно раз считана оттуда, но уже не может и не должна быть изменена. Историчность данных предполагает не только высокий уровень статичности (неизменности) как собственно данных (например: Петров продал в 2004 г . 51 компьютер Celeron), так и их взаимосвязей (например: в 2004 г . Петров работал в г.Сумы; в 2004 г . продавались компьютеры модели Celeron). А это, в свою очередь, дает возможность использовать специализированные, основанные на предположении о статичности данных и их взаимосвязей методы загрузки, хранения, индексации и выборки. Прогнозируемые данные Когда говорится о неизменности и статичности данных в аналитических системах, имеется в виду неизменность исключительно исторических данных (данных, описывающих уже произошедшие события). Существенным моментом является то, что такое предположение ни в коем случае не распространяется на Прогнозируемые данные (данные о событии, которое еще не происходило). Например, если строится прогноз об объеме продаж на сентябрь 2005 г . для менеджера Петрова, то, по мере поступления фактических (исторических) данных за 2004 г ., эта цифра будет многократно изменяться и уточняться. Более того, достаточно часто прогнозирование и моделирование затрагивает не только будущие, еще не произошедшие, но и прошлые, уже свершившиеся события. Например, анализ: "а, что будет (было бы)... если (бы)..?", строится на предположении о том, что значения некоторых данных, в том числе и из прошлого, отличны от реальных. И для ответа на вопрос: "Какой был бы прогноз по объему продаж компьютеров Celeron для менеджера Петрова на сентябрь 2005 г ., если бы объем продаж компьютеров Celeron в сентябре 2004 г . у него возрос на тот же процент, что объем продаж Pentium" потребуется не только вычислить новое, еще не существующее значение Объема Продаж, для еще не наступившего сентября 2005 г ., но и предварительно вычислить гипотетическое значение Объема продаж, за уже прошедший сентябрь 2004 г . В свою очередь, к оперативным данным, отражающим состояние некоторой предметной области в данный текущий момент времени, не применимы такие понятия, как прошлое или будущее. Для них существует единственное понятие - сейчас, а их основное назначение - адекватное детализированное отображение текущих событий (изменений), происходящих в реальном мире. Пример. Менеджер Петров продал еще один компьютер Celeron; менеджера Петрова перевели из Сумского филиала фирмы в Шосткинский. Вместе с тем изменчивость оперативных данных ни в коем случае не подразумевает их близость по свойствам к прогнозируемым данным. Между ними существует коренное различие. оперативным данным, в отличие от прогнозируемых, присуще свойство общезначимости, и обычно все пользователи работают с одним и тем же экземпляром данных. После того как в оперативную систему заведены данные о том, что Петров продал еще один компьютер, эта информация сразу же должна стать доступной всем заинтересованным в ней пользователям. Причем до тех пор, пока это изменение не зафиксировано, ни какой другой пользователь не имеет права изменять строку с информацией о продажах Петрова. Существенно иная ситуация с прогнозируемыми данными. Они носят, скорее, личностный (индивидуальный) характер. Вполне реальна ситуация, когда коммерческий директор фирмы и управляющий региональным отделением одновременно решили получить прогноз возможного объема продаж на 2006 г . для Петрова. Однако каждый из них делает собственный прогноз. Каждый из них может использовать свои функции прогнозирования, и, даже если применяется один и тот же метод (или функция), прогноз может основываться на различных исторических интервалах, и результаты, по всей вероятности, будут различны. Поэтому каждый из них работает с собственным экземпляром прогнозируемых данных (хотя эти данные и относятся формально к одной и той же личности, виду деятельности и времени), и эти данные не должны смешиваться. Конечно, вполне вероятно, что один из этих вариантов будет принят в качестве плановых показателей для Петрова. Но после того как прогноз утвержден в качестве плана, данные просто перейдут в другую категорию и станут историческими.