Информационные хранилища. Витрины данных. Документооборот. Системы электронного документооборота. (2ч).
Лекция № 21
Хранилище данных (data warehouse) –это автоматизированная информационно- технологическая система, которая собирает данные из существенных баз и внешних источников, формирует, хранит и эксплуатирует информацию как единую. Оно обеспечивает инструментарий для преобразования больших объемов детализированных данных в форму, которая удобна для стратегического планирования и реорганизации бизнеса и необходима специалисту, ответственному за принятие решений. При этом происходит слияние из разных источников различных сведений в требуемую предметно-ориентированную форму с использованием различных методов анализа.
Особенность новой технологии в том, что она предлагает среду накопления данных, которая не только надежна, но по сравнению с распределенными СУБД и оптимальна в отношении доступа к данным и манипулирования ими.
Хранилище информации предназначено для хранения, оперативного получения и анализа интегрированной информации по всем видам деятельности организации.
Данные в хранилище характеризуются следующими свойствами:
· предметная ориентация – данные организованы согласно предмету, а не приложению ( в соответствии со способом их применения);
· интегрированность – данные согласуются с определенной системой наименований, хотя могут принадлежать различным источникам и их формы представления могут не совпадать;
· упорядоченность во времени – данные согласуются во времени для использования в сравнениях, трендах и прогнозах;
· неизменяемость и целостность – данные не обновляются и не изменяются, а только перегружаются и считываются, поддерживая концепцию «одного правдивого источника».
· Большой объем и сложные взаимосвязи данных.
К основным категориям данных, которые располагаются в хранилище, относятся:
· метаданные, описывающие способы извлечения информации из различных источников, методы их преобразования из различных структур и форматов и доставки в хранилище;
· фактические данные (архивы), отражающие состояние предметной области и конкретные моменты времени;
· суммарные данные, полученные на основе проведенных аналитических расчетов.
В информационных хранилищах используются статистические технологии, генерирующие информацию об информации; процедуры суммирования; методы обработки электронных документов, аудио-, видеоинформации, графов и географических карт.
Витрины данных - небольшие хранилища с упрощенной архитектурой, предназначенные для хранения части данных информационного хранилища с целью снятия нагрузки с основного информационного хранилища. В основном витрины содержат ответы на конкретный ряд вопросов, например, данные АРМ сотрудников организации. Информация в разных витринах может дублироваться.
Рассмотрим три типа архитектуры информационных хранилищ: витрины данных, двух и трехуровневые архитектуры.
Двухуровневая архитектура информационного хранилища обеспечивает ретроспективные запросы (запросы данных за прошлые годы), анализ тенденций, поддержку принятия стратегических решений. Они ориентированы на оперативные базы организации и внешние источники, доступные по Интернету.
Трехуровневая архитектура информационного хранилища обеспечивает наличие информационного хранилища и витрин данных За счет использования витрин данных ускоряется обслуживание и увеличивается число пользователей по сравнению с двухуровневой архитектурой.
Примерами информационных хранилищ могут служить Oracle VLM, разработанная фирмами Oracle и Digital, Red Brick Warehouse 5.0 корпорации Red Brick Systems, Business Information Warehouse и др.