Инструменты разработки приложений.
Для обеспечения доступа пользователей к требуемой информации может потребоваться разработка собственных приложений с использованием графических сред доступа к данным, предназначенных для использования в системах архитектуры "клиент/сервер".
Инструменты информационной системы руководителя. Информационные системы руководителя (Executive Information System — EIS), которые в последнее время стали называть "информационными системами для всех" (Everybody Information System — EIS), первоначально разрабатывались для поддержки принятия высокоуровневых стратегических решений. Однако впоследствии область применения этих систем была несколько расширена с целью предоставления поддержки управляющему персоналу всех уровней.
OLАР-инструменты. Инструменты оперативной аналитической обработки данных, или OLAP-инструменты, создаются на основе концепции многомерной базы данных.
При использовании подобных инструментов предполагается, что данные организованы согласно многомерной модели, которая поддерживается специальной многомерной базой данных (Multi-Dimensional Database — MDDB) или реляционной базой данных, предназначенной для работы с многомерными запросами. Подробно OLAP-инструменты будут рассмотрены далее.
Инструменты разработки данных (добычи знаний). Добыча знаний — это процесс открытия новых осмысленных корреляций, распределений и тенденций путем переработки огромного количества информации извлеченной из хранилища данных, с использованием статистических и математических методов, а также методов искусственного интеллекта. Методы добычи знаний обладают достаточным потенциалом, так как главным притягательным фактором использования технологии добычи знаний является способность создавать предсказательные, а не ретроспективные модели. Обзор методов добычи данных будет дан далее.
Требования к СУБД для хранилища данных.Специализированные требования к реляционной СУБД, предназначенной для хранилища данных, следующие:
· Высокая производительность загрузки данных.
· Возможность обработки данных во время загрузки.
· Наличие средств управления качеством данных.
· Высокая производительность запросов.
· Широкая масштабируемость по размеру (до терабайт).
· Масштабируемость по количеству пользователей.
· Возможность организации сети хранилищ данных.
· Наличие средств администрирования хранилища.
· Поддержка интегрированного многомерного анализа.
· Расширенный набор функциональных средств запросов
Вслед за появлением и быстрым развитием понятия хранилища данных появилась и близкая ему концепция магазина данных (data mart). Используется также название "витрина данных".
Магазин данных - подмножество хранилища данных, которое поддерживает требования отдельного подразделения или деловой сферы организации.
Магазин данных содержит некоторое подмножество данных хранилища данных, которое обычно представлено в виде обобщенной информации, связанной некоторым подразделением или деловой сферой предприятия. Магазин данных может быть независимым или определенным образом связанным с централизованным хранилищем данных.
Популярность магазинов данных основана на том очевидном факте, что корпоративные хранилища данных создавать и использовать сложнее.
Ниже перечислены основные отличительные черты магазина данных от хранилища данных:
· Магазин данных отвечает требованиям пользователей только одного подразделений организации или некоторой ее деловой сферы.
· Магазин данных обычно не содержит детальных оперативных данных, в отличие от хранилища данных.
· Поскольку магазин данных содержит меньше информации, чем хранилище, структура информации магазина данных более понятна и проста в управлении.
Существует несколько подходов к созданию магазинов данных:
1. Один из них заключается в создании корпоративного хранилища данных, которое может непосредственно использоваться пользователями, а также поставлять сведения для магазинов данных.
2. Другой подход заключается в создании нескольких магазин данных с возможностью их интеграции в виде единого хранилища данных.
3. Третий подход основан на создании инфраструктуры корпоративного xранилища данных с одновременным созданием одного или нескольких магазинов данных, предназначенных для удовлетворения насущных бизнес-потребностей организации.
Существует несколько перечисленных ниже причин, по которым следует создавать магазины данных:
· Для предоставления пользователям доступа к данным, которые приходится анализировать чаще других.
· Для предоставления данных группе пользователей некоторого отдела или деловой сферы в форме, которая соответствует их коллективному представлению о данных.
· Для сокращения времени ответа на запрос (за счет сокращения объема обрабатываемых данных).
· Для предоставления данных, структурированных в соответствии с требованиями, предъявляемыми используемыми инструментами доступа к данным.
· Магазины данных обычно содержат меньшее количество данных, а потому такие задачи, как очистка, загрузка, преобразование и интеграция данных, выполняются проще. Следовательно, реализация и настройка магазина данных выполняется проще, чем разработка и реализация корпоративного хранилища данных.
· Стоимость реализации магазина данных обычно существенно ниже, чем стоимость создания хранилища данных.
· Круг потенциальных пользователей магазина данных более четко определен, поэтому учесть их требования и организовать необходимую поддержку проще, чем в случае корпоративного хранилища данных.