Назад | Перейти на главную страницу

Создание хранилища данных

Я видел учебные статьи и сообщения о том, как создавать хранилища данных со схемами звезд и снежинок, денормализацией таблиц фактов и измерений баз данных OLTP и так далее.

Также видел такие комментарии:

Звездообразные схемы в лучшем случае предназначены для карт данных. Совершенно невозможно представить настоящее корпоративное хранилище данных в виде звездообразной схемы или снежинки.

Я хочу создать базу данных, которая будет сервером для служб отчетов и, возможно (если этого недостаточно), установить службы анализа и извлекать отчеты и данные из кубов.

Мой вопрос был таков: действительно ли необходимо изменить мою текущую базу данных и следовать схемам звезды / снежинки с таблицами фактов и измерений?

Спасибо

Есть несколько вещей, на которые я хотел бы обратить внимание, прежде чем переделывать вашу базу данных.

  1. Я почти уверен, что службам отчетов не нужна звезда / снежинка для выполнения своей работы, поэтому вы можете увидеть, что вы можете построить с помощью своей номинальной базы данных.
  2. Попробуйте создать представления, которые денормализуют ваши данные OLTP. Это заставит вас задуматься об аспектах дизайна, которые вам понадобятся, если вы действительно перепроектируете свою базу данных.

Это в значительной степени так, если вы не сбросите всю сторону SQL и не создадите репозиторий в кубе - в этом случае вы МОЖЕТЕ уйти с схемой OLTP, лежащей в основе данных.

Основная проблема заключается в том, что подход, не использующий звездообразную схему, просто ложится большой нагрузкой на сервер для анализа. Тем не менее, идея подать в суд на аналитические службы потрясающая - они блестят в этой области. Просто попробуйте, можете ли вы загрузить их напрямую из ... схемы OLTP, возможно, ее снимка.

Другая часть логики хранилища данных заключается в том, что любые вычисления для обработки или преобразования данных выполняются до их загрузки в конкретную схему, так что большая часть того, что извлекается из хранилища данных, «готово к использованию».

Я бы порекомендовал хорошую книгу на эту тему: http://www.amazon.co.uk/Microsoft-Data-Warehouse-Toolkit-Intelligence/dp/0471267155/ref=sr_1_3?ie=UTF8&s=books&qid=1272019644&sr=8-3

Хотя он нацелен на 2005 год (версия 2008 года, я думаю, находится в стадии разработки), общая теория остается в силе, и этапы проектирования и планирования в любом случае практически не зависят от платформы.

На вес золота, если хочешь попасть в DW :)