Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Хранилища данных и анализ





ХД строятся на основе многомерной модели данных. Многомерная модель данных подразумевает выделение отдельных измерений (время, география, клиент, счет) и фактов (объем продаж, доход, количество товара), которые анализируются по выбранным измерениям. Многомерная модель данных физически может быть реализована как в многомерных СУБД, так и в реляционных. В последнем случае она выполняется по схеме «звезда» или «снежинка». Данные схемы предполагают выделение таблиц фактов и таблиц измерений. Каждая таблица фактов содержит детальные данные и внешние ключи на таблицы измерений. Концепция ХД не является законченным архитектурным решением СППР. Цель концепции ХД – определить требования к данным, помещаемым в ХД, общие принципы и этапы построения ХД, определить основные источники данных, предупредить возможные проблемы, возникающие по выгрузке данных, очистке, согласованию, транспортировке и загрузке. Следует учитывать, что разработка ХД – это не концепция анализа данных, а концепция подготовки данных для анализа. Концепция ХД не предопределяет архитектуру целевой СППР, а говорит о том, какие процессы анализа будут происходить в системе, и обеспечивает решение таких проблем, как:

– выбор наиболее эффективного для анализа способа организации данных;

– организация данных;

– использование технологии анализа.

Проблемы использования данных решают подсистемы анализа. Информационно-аналитические системы, создаваемые в расчете на непосредственное использование лицами, принимающими решения, оказываются чрезвычайно простыми в применении, но жестко ограниченными в функциональности. Такие статические системы, как уже упоминалось, называются исполнительными информационными системами (EIS). Они содержат в себе предопределенные множества запросов и, будучи достаточными для повседневного обзора, неспособны ответить на все вопросы, возникающие в процессе принятия решений. Результатом работы такой системы являются многостраничные отчеты, после изучения которых у аналитика появляется новая серия вопросов. Однако каждый новый непредусмотренный запрос должен быть сначала формально описан, закодирован программистом и только затем выполнен, на что необходимо в большинстве случаев достаточно много времени. Таким образом, внешняя простота статических СППР, за которую активно борется большинство заказчиков информационно-аналитических систем, оборачивается катастрофической потерей гибкости.

Динамические СППР ориентированы на обработку нерегламентированных запросов аналитиков к данным. Работа аналитиков с этими системами заключается в интерактивной последовательности формирования запросов и изучения их результатов. Динамические СППР могут действовать на основе накопленных данных в трех областях.

Работас детализированными данными – это область действия многих поисковых систем. В большинстве случаев с возникающими здесь задачами справляются реляционные СУБД. Общепризнанным стандартом языка манипулирования реляционными данными является SQL. Информационно-поисковые системы, обеспечивающие интерфейс конечного пользователя в задачах поиска детализированной информации, могут использоваться в качестве надстроек как над отдельными базами данных, так и над общим хранилищем данных. Формирование агрегированных показателей обеспечивает комплексный взгляд на собранную в ХД информацию. Обобщение и агрегация детальных данных, гиперкубическое представление и многомерный анализ являются задачами систем оперативной аналитической обработки данных (OLAP). Здесь можно использовать специальные многомерные СУБД или оставаться в рамках реляционных технологий. Во втором случае заранее агрегированные данные могут собираться в БД звездообразного вида, либо агрегация информации может производиться в процессе сканирования детализированных таблиц реляционной БД. Поиск з акономерностей относится к интеллектуальной обработке данных и производится методами интеллектуального анализа данных (ИАД, Data Mining), главными задачами которых являются поиск функциональных и логических закономерностей в накопленной информации, построение моделей и правил, которые объясняют найденные аномалии и/или прогнозируют развитие некоторых процессов.

Полная структура информационно-аналитической системы, построенной на основе ХД, показана на рис. 43.

 

Рис. 43. Полная структура корпоративной информационно-аналитической
системы (ИАС)

В конкретных реализациях отдельные компоненты этой схемы часто отсутствуют.







Date: 2015-09-23; view: 778; Нарушение авторских прав



mydocx.ru - 2015-2025 year. (0.005 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию