Home » Fragmenty książek

Business Intelligence — fragment

3 czerwca 2009 No Comment

Tekst jest fragmentem książki „Business Intelligence. Systemy wspomagania decyzji biznesowych” J. Surmy (Wydawnictwo Naukowe PWN, 2009). Zamieszczenie w celach informacyjnych i niewielka redakcja do potrzeb tekstu za zgodą Wydawcy.

Notkę o książce znajdziesz tutaj:
http://wiedzaiedukacja.eu/archives/17019

Hurtownie danych – wprowadzenie

W pierwszym rozdziale książki zdefiniowano Business Intelligence oraz zaprezentowano przegląd zastosowań BI w wybranych obszarach biznesowych. Za tymi rozwiązaniami, niejako w tle, stoją podstawowe narzędzia BI. Przed ich szczegółowym omówieniem trzeba przedstawić technologiczną warstwę systemów BI, czyi i architekturę hurtowni danych. Wydaje się zrozumiałe, że omówione wcześniej przykłady rozwiązań biznesowych wykorzystują różnego rodzaju dane. To, jak są one zbierane i organizowane w celu ich wykorzystania do analiz biznesowych, jest przedmiotem niniejszego rozdziału.

W źródłach danych, np. w systemie magazynowym w ramach systemów transakcyjnych, są rejestrowane dane operacyjne, czyli dane związane z pojedynczymi, konkretnymi zdarzeniami gospodarczymi. W wypadku systemu magazynowego może to być na przykład informacja o tym. że dany towar został przyjęty „na magazyn”. Dane te są przesyłane do hurtowni danych i tam odpowiednio przetwarzane i łączone z innymi danymi. Z hurtowni dane są odczytywane w celu realizacji odpowiednich analiz biznesowych. Na przykład informacje o przyjęciach i wydaniach towarów z całego miesiąca mogą posłużyć, w ramach analizy OLAP do rozpoznania grupy towarów, które zalegają w magazynie. Połączenie tych danych z informacją o kosztach składowania poszczególnych towarów, pobraną z systemu kontrolingowego, umożliwi pełną analizę kosztów magazynowania zalegających towarów.

Istotne jest zrozumienie powodów budowania hurtowni danych. Można wyróżnić co najmniej cztery takie przyczyny. Hurtownia danych umożliwia:
•   Przeprowadzanie analiz biznesowych bez ingerencji w operacyjną pracę systemów transakcyjnych (OLTP). Analizy biznesowe zazwyczaj wymagają złożonych i czasochłonnych obliczeń. Realizacja tych zadań nie może wpływać na codzienną operacyjną pracę systemów zawierających dane źródłowe. Na przykład analiza sprzedaży oparta na agregacji danych z faktur zarejestrowanych w systemie transakcyjnym nie może spowodować opóźnienia w wystawianiu bieżących faktur.
•   Całościowy wgląd w dane firmy, tzn. możliwość integracji danych z różnych źródeł, dającej pełniejszy obraz zdarzeń gospodarczych zachodzących w przedsiębiorstwie. Na przykład w firmie telekomunikacyjnej może to być ustalenie wartości całkowitej sprzedaży danemu klientowi nie tylko na podstawie liczby rozmów zarejestrowanych w systemie billingowym, ale również wartości akcesoriów zakupionych przez klienta w sklepach firmowych (te dane są zarejestrowane w systemie sprzedażowym).
•   Dostęp do danych historycznych. Jest to wynik rejestracji momentu wystąpienia danego zdarzenia oraz długiego, nawet kilkunastoletniego przechowywania danych. Dzięki danym historycznym możliwe jest wykonanie większości podstawowych analiz biznesowych.
•    Ujednolicenie posiadanych informacji. Poprawne wdrożenie hurtowni danych wymusza ujednolicenie pojęć i sprawia, że wynikowe wskaźniki są tak samo interpretowane w różnych działach firmy i w jednolity sposób obliczane. Niweluje to tzw. problem wielu wersji prawdy firmy, zależących od tego, kto jest twórcą danego raportu.

Za ogólnie przyjętą definicję hurtowni danych uznaje się definicję Billa Inmona (2005):

Hurtownia danych to:
•   uporządkowany tematycznie (subject oriented),
•   zintegrowany (intergrated),
•   zawierający wymiar czasowy (time variant),
•   nieulotny (non-volatile)

zbiór danych (baza danych) wspomagających podejmowanie decyzji.

Przy czym:
•  „Uporządkowany tematycznie” oznacza ograniczenie zbieranych danych do określonego obszaru biznesowego, np. sprzedaży, a nie działań czy procesów biznesowych. W praktyce hurtownia danych może obejmować wiele obszarów biznesowych. Hurtownia danych ograniczona do jednego obszaru biznesowego, a nawet działu, zwykle jest określana jako „data mart”, czyli lokalna hurtownia, na ogół stanowiąca podzbiór hurtowni korporacyjnej.
•   „Zintegrowany” oznacza ujednolicenie danych co do formatu, zakresu dopuszczalnych wartości oraz w szerszym znaczeniu – powiązanie (mapping) danych pochodzących z różnych źródeł.
•   „Zawierający wymiar czasowy” oznacza, że wszystkie dane ładowane do hurtowni danych dostają tzw. stempel czasowy. Umożliwia to śledzenie zmian oraz badania analityczne w określonych interwałach czasu.
•   „Nieulotny” oznacza, że dane raz umieszczone w hurtowni zostają zapamiętane i nie podlegają usunięciu. Po załadowaniu jedyną, przynajmniej formalnie, operacją, jaką można na nich wykonać, jest operacja odczytu.

Leave your response!

You must be logged in to post a comment.