СОДЕРЖАНИЕ
Введение
1 Вечное хранение данных
2 Важная терминология
3 Базы и хранилища данных
4 Неизменный спутник хранилищ данных
5 Некоторые аспекты хранения данных
5.1 Структуры хранения данных
5.2 Поставщики
6 Несколько советов по повышению производительности OLAP-кубов
Вывод
Литература
Введение
Тема контрольной работы «Хранилища данных и OLAP- средства».
Сегодня во многих организациях проблема использования большого объема собранных за многие годы данных ощущается все острее. В течение многих лет на предприятиях накапливаются и хранятся огромнейшие массивы информации, но при этом ее большая часть не может быть использована аналитиками и руководителями. Чаще всего эта информация доступна лишь тем подразделениям, в которых она накапливается. Поэтому и возникает потребность в системах, позволяющих получать необходимую «аналитику». Хотя в современных бизнес-приложениях все больше и больше появляется средств для аналитического анализа информации, тем не менее, достаточно много «аналитики» скрыто в данных предшествующих периодов деятельности, когда на предприятиях еще не было современных информационных систем.
1 Вечное хранение данных
Кроме оперативных баз данных (БД), источником информации в хранилищах данных (ХД) являются текстовые файлы. «Очищенные» данные, попадающие в ХД, не используются напрямую системами представления и анализа. Для этих целей используются витрины данных, позволяющих пользователям работать только с теми данными, которые им нужны. При этом повышается безопасность доступа к данным, а их структура отражает требования пользователя и снижается нагрузка на основное ХД.
Предметная ориентация - ключевое отличие оперативных БД от ХД. Разные приложения БД могут описывать одну и ту же предметную область с разных точек зрения и решение, принятое на основе данных, отражающих только одну сторону вопроса, могут быть неэффективными, а порой и просто неверными.
В оперативных БД информация может добавляться, удаляться и изменяться, а в ХД данные могут только загружаться и читаться. При этом все данные в ХД данных делятся на три основных категории:
2 Важная терминология
Хранилище данных (Data Warehouse). Предметно-ориентированный, интегрированный, неизменяемый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений (по определению основателя хранилищ данных Б. Инмона). Более просто: это база данных, хранящая данные, агрегированные по многим измерениям.
Витрина (или киоск) данных (Data Mart). Небольшое хранилище, а конечные пользователи могут создавать собственные структуры данных в нем.
Информационная система руководителя (ИСР) (Executive Information System([EIS)). Приложения, созданные для использования руководителями.
Средства OLAP (On-line Analytical Processing). Инструментарий навигации по многомерным данным.
MOLAP (Multidimensional OLAP). Детальные данные и агрегаты хранятся в многомерной БД. В этом случае получается наибольшая избыточность, так как многомерные данные полностью содержат реляционные.
ROLAP (Relational OLAP). ............