Непроектируемые витрины данных

Интегрированное ХД - хранилище данных

В 1994 году M. Demarest предложил объединить концепции ХД и ВД в одной реализации, и использовать ХД в качестве единого интегрированного источника для многочисленных ВД. В таком варианте корпоративная информационно-аналитическая система имеет трехуровневую структуру: Общекорпоративное централизованное ХД Общекорпоративное централизованное ХД на основе одной из развитых современных реляционных СУБД. Это ХД интегрированных в основном детализированных данных. Реляционные СУБД обеспечивают эффективное хранение и управление данными очень большого объема, но не слишком хорошо соответствуют потребностям OLAP-систем, в частности, в связи с требованием многомерного представления данных; Тематические ВД (витрины данных) на уровне подразделений Поддерживаются ВД на основе многомерной системы управления базами данных (примером такой системы является Oracle Express Server ). Такие СУБД почти идеально подходят для целей разработки OLAP-систем, но пока не позволяют хранить сверхбольшие объемы данных (предельный размер многомерной БД составляет 10-20 гигабайт). В данном случае это и не требуется, поскольку речь идет о ВД. Заметим, что ВД не обязательно должен быть полностью сформирован. Он может содержать ссылки на ХД и добирать оттуда информацию по мере поступления запросов. Конечно, это несколько увеличивает время отклика, но зато снимает проблему ограниченного объема многомерной БД; Рабочие места конечных пользователей Рабочие места конечных пользователей, снабженные аналитическим инструментарием оперативного анализа данных.
Появление непроектируемых витрин данных (Non - Architected Data Marts) объясняется, прежде всего, сложностями, связанными с реализацией систем EDW и FDW. «Грязные» и быстро получаемые наборы данных не подвергаются очистке и, следовательно, не могут использоваться для дальнейшей интеграции с любыми другими источниками данных систем ХД. Очень быстро они превращаются в устаревшие системы, отдельно стоящие информационные "дымоходы", которые только добавляют проблемы, а не решают их. Для этих систем характерны многочисленные процессы извлечения, множество бизнес-правил, недостоверность информации (см. рисунок). Достоинства непроектируемых витрин данных
  • быстрота
  • низкая стоимость
Недостатки
  • недостоверная информация.
  • многочисленные процессы извлечения.
  • многочисленные бизнес-правила.
  • множественная семантика.
  • повышенная сложность при интеграции.