OLAP или развитые аналитические инструменты
OLAP (Online Analytical Processing) – инструмент анализа данных, ориентированный на непрограммистов. Ранние воплощения OLAP появились в 1980-х годах, а бум пришелся на середину 1990-х. Технология OLAP успешно преодолела пик ажиотажа и стала одной из важных составляющих бизнес-интеллекта.
Инструменты OLAP являются аналитическими инструментами, которые первоначально были основаны на многомерных базах данных (МБД).
МБД – это базы данных, сконструированные специально для поддержки анализа количественных данных с множеством измерений. Большинство приложений включают измерение времени, другие измерения могут касаться географии, организационных единиц, клиентов, продуктов и др.
Технология OLAP позволяет аналитикам, менеджерам и управляющим сформировать свое собственное видение данных, используя быстрый, единообразный, оперативный доступ к разнообразным формам представления информации.
OLAP-системы выполняют следующие функции: извлечение, преобразование и загрузка информации из разнообразных информационных систем компании в хранилище данных; многомерный анализ бизнес-данных во всевозможных гибко настраиваемых разрезах (например: время, подразделение, услуга с необходимой степенью детализации, объём услуги и т. п.) за выбранные промежутки времени с необходимой степенью детализации; выполнение нерегламентированных запросов к информации для получения оперативных отчётов по требованию.
Для поддержки МБД используются OLAP-серверы, оптимизированные для многомерного анализа и поставляемые с аналитическими возможностями.
Клиент-серверная архитектура OLAP-продуктов может обеспечить большое количество пользователей одновременным доступом. При этом по всем аспектам информации анализ должен производиться одинаково быстро, независимо от размера и сложности организации БД. Таким образом, OLAP предоставляет удобные быстродействующие средства доступа, просмотра и анализа деловой информации.
Сегодня многомерный анализ поддерживают и реляционные СУБД. OLAP для реляционных БД (ROLAP) имеет преимущество по масштабируемости и гибкости, но проигрывает по производительности многомерному OLAP (MOLAP).
Data mining (интеллектуальный анализ данных) Дословно переводится как «добыча данных». Представляет собой процесс выявления скрытых, полезных фактов и взаимосвязей в крупных массивах данных. Выполняется путем тщательного исследования данных с использованием технологий распознавания шаблонов, а также статистических и математических методов. При разведке данных многократно выполняются различные операции и преобразования над сырыми данными.
Данные, которые были получены в результате использования средств Data mining описывают новые связи между свойствами, предсказывают одни значения признаков на основе других. В круг задач, которые решает Data mining входят:
- Классификация - структуризация объектов по заданным классам
- Ассоциация - выявление ассоциативных цепей. Впервые такой метод был применен для анализа рыночной корзины типичного потребителя.
- Кластеризация - группировка событий и наблюдений в кластеры. В основу берутся свойства описывающие суть самих группируемых событий
- Прогнозирование - предсказание на основе имеющихся данных возможного развития событий как прогрессивное, так и регрессивное.
- Анализ изменений - выявление типичных ситуаций, шаблонов. Сюда входит и установление закономерностей между различными временными событиями, равно как и обнаружение зависимостей и причинно-следственных связей.
Интеллектуальный анализ данных можно использовать для решения любых бизнес-проблем, в которых фигурирует различная изменяющаяся с течением времени информация, включая:
- Анализ желаний и потребностей.
- Идентификация клиентов, приносящих прибыль, и приобретение новых.
- Продажа дополнительных товаров и услуг существующим клиентам.
- Оценка кредитных рисков.
- Общий мониторинг эффективности бизнеса и т.д.