Цели и задачи хранилищ данных

Кроме определенной выше глобальной цели – создание единой модели данных, можно выделить т.н. «краткосрочные цели», которые дают немедленный выигрыш пользователям на каждом этапе реализации ХД. Вот несколько примеров краткосрочных целей. Краткосрочные цели Улучшение качества данных Поскольку обычным недостатком СППР являются "грязные данные", пользователь должен уделять внимание качеству своих данных на каждом этапе реализации ХД. Очистка данных представляет собой проблему в организации Хранилищ: с одной стороны, предполагается, что ХД обеспечит чистые, интегрированные, соответствующие и согласованные данные, извлеченные из множества источников; с другой стороны, есть расписание разработки, составленное в расчете на 6-12 месяцев. Практически невозможно достичь обеих целей одновременно, не идя на какие-либо компромиссы. Трудность в том, чтобы определиться с существом этих компромиссов. Подготовка данных для СППР Создание ХД позволяет произвести следующий этап автоматизации деятельности предприятия — подготовить данные для систем поддержки принятия решений. Основным отличием деятельности по принятию решений от исполнительской деятельности, с точки зрения используемых данных, является потребность во всестороннем видении процессов во всем многообразии параметров, от которых они зависят, за различные временные промежутки. Для создания систем поддержки принятия решений необходима полная, непротиворечивая, информация за различные временные промежутки, которая может быть как обобщена (просуммирована или агрегирована другим способом), так и детализирована. Минимизация количества несовместимых отчетов Другой распространенной проблемой сегодняшних сред СППР является несовместимость отчетов. Несовместимые отчеты в основном происходят от неправильного использования данных, и первопричиной этого является разногласия или непонимание значения или содержимого данных. Захват и доступ к метаданным Метаданные необходимы для совместного доступа к данным и навигации по ним. Сегодня к большинству данных нет совместного доступа по многим причинам, одной из которых является непонимание данных, а другой - недоверие к содержимому данных. Как только исходные данные очищены, преобразованы, агрегированы, просуммированы и рассечены несколькими различными способами, пользователи никогда снова не найдут их в ХД без помощи метаданных. Захват метаданных (то есть, определений данных, доменов, алгоритмов преобразования исходных данных, столбцы и таблицы, в которых находятся результирующие данные, и все другие технические компоненты) представляет собой возможное решение Обеспечение возможности совместного доступа к данным Если совместный доступ к данным является одной из задач ХД, то необходимо включить туда некоторую очистку данных, урегулирование разногласий по данным и компоненты средств доступа, основанные на метаданных в качестве инструментов достижения этой цели. Эти компоненты представляют собой предварительные условия совместного доступа к данным. Двумя другими существенными компонентами являются проектирование БД и организация доступа к ней. Проектирование БД - Базы Данных После того, как проанализированы требования, необходимые данные логически смоделированы и относящиеся к ним метаданные захвачены в репозиторий, следующим шагом является проект БД. Проектирование самостоятельной БД для одного бизнес-подразделения отличается от проектирования БД совместного доступа для множества бизнес-подразделений. Интеграция данных из множества источников Это существенная задача для всех ХД, поскольку это первостепенная проблема в различных СППР. Самостоятельные системы, имеющие одни и те же данные, идентифицируемые различными ключами, представляют собой одну из причин того, почему в большинстве компаний отсутствует интеграция данных. Некоторые другие причины заключаются в том, что содержимое данных в одном файле находится на отличном от другого файла уровне детализации или в том, что одни и те же данные модернизируются с разной периодичностью в различных файлах. Соединение исторических данных с текущими данными Типичной задачей ХД является сохранение истории. Эта задача сопровождается своими проблемами. Исторические данные редко хранятся в операционных системах, и даже если они там хранятся, трудно найти трехлетнюю или пятилетнюю историю в рамках одного файла