Hurtownia danych



Internet jest niewyczerpanym źródłem wiedzy, także jeśli chodzi o Hurtownia danych. Wieki i stulecia ludzkiej wiedzy o Hurtownia danych zostały przelane, i nadal są przelewane, do sieci, i właśnie dlatego dostęp do niej jest tak trudny, ponieważ możemy znaleźć miejsca, w których nawigacja może być trudna lub wręcz niewykonalna. Proponujemy, abyś nie rozbił się w morzu danych dotyczących Hurtownia danych i abyś mógł szybko i sprawnie dotrzeć do wszystkich portów mądrości.

Mając na uwadze ten cel, zrobiliśmy coś, co wykracza poza to, co oczywiste - zebraliśmy najbardziej aktualne i najlepiej wyjaśnione informacje na temat Hurtownia danych. Ułożyliśmy je również w sposób ułatwiający czytanie, z minimalistycznym i przyjemnym wyglądem, zapewniając najlepsze wrażenia użytkownika i najkrótszy czas ładowania. Ułatwiamy Ci to, abyś musiał się martwić tylko o to, by dowiedzieć się wszystkiego o Hurtownia danych! Jeśli więc uważasz, że osiągnęliśmy nasz cel i wiesz już wszystko, co chciałeś wiedzieć o Hurtownia danych, z przyjemnością przyjmiemy Cię z powrotem na te spokojne morza sapientiapl.com, gdy tylko Twój głód wiedzy zostanie ponownie rozbudzony.

Hurtowni danych ( DWH lub DW za krótki ; dosownie hurtowni danych) jest centraln baz danych , która zostaa zoptymalizowana dla celów analizy i przynosi ze sob dane z kilku, zazwyczaj heterogenicznych róde. Termin pochodzi z zarzdzania informacj w informatyce biznesowej . Pene dane, na przykad z firmy lub wikszego projektu, które s zwykle dostpne jako dane surowe i nie zostay jeszcze przetworzone lub wybrane zgodnie z okrelonymi specyfikacjami, s przechowywane w jeziorach danych .

semestr

W poowie lat osiemdziesitych IBM stworzy termin hurtownia informacji . Termin hurtownia danych zosta po raz pierwszy uyty w 1988 roku przez Barry'ego Devlina .

Obecnie nie ma standardowej definicji terminu hurtownia danych. Jednak w duej mierze obowizuj nastpujce zasady:

  • Hurtownia danych umoliwia globalny widok heterogenicznych i rozproszonych zasobów danych, czc dane istotne dla widoku globalnego ze róde danych we wspólny, spójny zbiór danych. Umoliwia to wygodny dostp do danych.
  • Zawarto hurtowni danych powstaje poprzez kopiowanie i przetwarzanie danych z rónych róde.
  • Hurtownia danych jest zwykle podstaw do agregacji kluczowych danych operacyjnych i opartych na nich analiz, czyli tzw. Przetwarzania analitycznego online (OLAP).
  • Hurtownia danych jest czsto punktem wyjcia do eksploracji danych .
  • Aplikacje czsto wspópracuj z charakterystycznymi dla aplikacji wycigami z hurtowni danych, tzw. Zbiornikami danych .

Rónice w definicjach mona znale gównie w ogólnym przeznaczeniu hurtowni danych oraz w zakresie i obsudze danych w hurtowni danych.

  • Zakres definicji zaczyna si od restrykcyjnego pogldu Billa Inmona :
    Hurtownia danych to zorientowany tematycznie, zintegrowany, chronologiczny i trway zbiór danych wspierajcy zarzdzanie w procesach decyzyjnych .
    W oryginale: Hurtownia danych to zorientowany podmiotowo, zintegrowany,
    zmienny w czasie, nieulotny zbiór danych wspierajcych proces podejmowania decyzji przez kierownictwo. Definicj wedug Inmon mona interpretowa nastpujco:
    • tematyczny: dane, które maj by przesane do hurtowni danych, s wybierane na podstawie pewnych obiektów danych (produkt, klient, firma, ...), które s istotne dla analizy kluczowych danych dla procesów decyzyjnych, ale nie wedug procesy operacyjne
    • zintegrowane (standaryzacja): dane, które maj rón struktur w rónych (operacyjnych) systemach ródowych, s przechowywane w hurtowni danych w ustandaryzowanej formie.
    • zmienno czasowa (orientacja czasowa): w hurtowni danych powinna by moliwa analiza zmian i zmian zachodzcych w czasie; dlatego konieczne jest dugotrwae przechowywanie danych w hurtowni danych (wprowadzenie wymiaru czasu).
    • nieulotna (trwao): dane s przechowywane na stae (nieulotne).
  • Ponisze definicje Bauera i Günzela, a take Kimballa, s mniej restrykcyjne, ale s ukierunkowane na specjalny cel, funkcj analizy:
    Hurtownia danych to fizyczna baza danych, która reprezentuje zintegrowany widok (dowolnych) danych w celu umoliwienia analizy.
    Hurtownia danych to kopia danych transakcyjnych o specjalnej strukturze umoliwiajcej tworzenie zapyta i raportowanie.
  • Zakres definicji koczy si definicj palca stopy, która jest bez ogranicze co do zakresu i przetwarzania danych oraz bez zamierzonego celu:
    Hurtownia danych to fizyczna baza danych, która umoliwia zintegrowany widok bazowych róde danych.

Ograniczenie fizyczne jest konieczne, aby oddzieli hurtowni danych od logicznego stowarzyszonego systemu baz danych .

Operacja (hurtownia danych)

Tworzenie hurtowni danych opiera si na dwóch zasadach przewodnich:

  1. Integracja danych z rozproszonych i rónie ustrukturyzowanych baz danych w celu umoliwienia globalnego podgldu danych ródowych, a tym samym kompleksowych ocen w hurtowni danych.
  2. Oddzielenie danych wykorzystywanych w dziaalnoci operacyjnej od danych wykorzystywanych w hurtowni danych do zada takich jak raportowanie, wspomaganie decyzji, analiza biznesowa , kontroling i zarzdzanie przedsibiorstwem.

Cay proces pozyskiwania danych, administrowania i oceny hurtowni danych jest równie nazywany hurtowni danych . Hurtownie danych obejmuj:

  • Pozyskiwanie danych, integracja danych ( etapowanie ) i dalsze przetwarzanie w procesie ETL
  • Przechowywanie danych, czyli dugotrwae przechowywanie danych w hurtowni danych (patrz take archiwizacja dugoterminowa )
  • Ocena i analiza danych
  • Dostawa i przechowywanie oddzielnych zasobów danych wymaganych do analizy, zbiorniki danych .

W bazach danych dane s czsto przechowywane jako wielowymiarowe macierze w tak zwanym schemacie gwiadzistym lub w powizanych schematach danych , takich jak patki niegu i schematy galaktyk .

W ostatnich latach nastpio coraz wiksze odchodzenie od regularnego adowania w kierunku adowania hurtowni danych w czasie rzeczywistym (hurtownia danych w czasie rzeczywistym). Niektóre brane, takie jak brana telekomunikacyjna i handel detaliczny, potrzeboway danych, które byy natychmiast dostpne, przy jednoczesnym zachowaniu oddzielenia systemów operacyjnych i systemów oceny. Magazynowanie danych w czasie rzeczywistym umoliwia równie odtwarzanie wyników bezporednio w systemach operacyjnych. W ten sposób wyniki analizy danych z hurtowni danych wpywaj z kolei na systemy operacyjne zasilajce hurtowni danych (zamknita ptla).

Aplikacje

  • Integracja danych z rónie ustrukturyzowanych i rozproszonych baz danych w celu zapewnienia globalnego widoku danych ródowych, a tym samym kompleksowych ocen
  • Znajdowanie ukrytych relacji midzy danymi poprzez eksploracj danych
  • Szybka i elastyczna dostpno raportów, statystyk i kluczowych danych, na przykad w celu okrelenia relacji midzy rynkiem a zakresem usug
  • Kompleksowe informacje o obiektach biznesowych i relacjach
  • Przejrzysto w czasie w zakresie procesów biznesowych, kosztów i wykorzystania zasobów
  • Dostarczanie informacji, na przykad w celu tworzenia katalogów produktów.

Ryzyka

59. konferencja federalnych i stanowych inspektorów ochrony danych od 14./15. Marzec 2000 w uchwale w sprawie hurtowni danych, eksploracji danych i ochrony danych zwraca uwag na ryzyko prawne zwizane z tymi praktykami.

W szczególnoci zagroone jest podstawowe prawo do informacyjnego samostanowienia i ochrony prywatnoci.

Powodem tego jest moliwo wspomnianych procedur zapisywania i wykorzystywania danych osobowych poza ich celem, co jest niezgodne z prawem w okrelonych okolicznociach. Zaleca si stosowanie technik wykorzystujcych zanonimizowan lub pseudonimizowan form pierwotnie osobowej formy danych.

literatura

  • Jan Holthuis: Struktura systemów magazynowych, koncepcja, modelowanie danych, procedura. Deutscher-Universitäts-Verlag, ISBN 3-8244-6959-6 .
  • Ralph Hughes: Agile Data Warehousing for the Enterprise . Morgan Kaufmann, Waltham, Massachusetts 2015, ISBN 978-0-12-396518-9 .
  • Hans Hultgren: Modelowanie elastycznej hurtowni danych za pomoc Data Vault . Brighton Hamilton, Denver i in. 2012, ISBN 978-0-615-72308-2 .
  • William H. Inmon, Richard D. Hackathorn: Korzystanie z hurtowni danych. John Wiley & Sons, ISBN 0-471-05966-8 .
  • Reinhard Jung, Robert Winter: Strategia hurtowni danych. Springer, ISBN 3-540-67308-3 .
  • H.-G. Kemper, W. Mehanna, C. Unger: Business Intelligence. Podstawy i praktyczne zastosowanie. Vieweg, ISBN 3-528-05802-1 .
  • Ralph Kimball , Margy Ross: zestaw narzdzi hurtowni danych. Ostateczny przewodnik po modelowaniu wymiarowym . Wydanie trzecie. Wiley, Nowy Jork 2013, ISBN 978-1-118-53080-1 .
  • Wolfgang Lehner: Technologia baz danych dla systemów hurtowni danych. Koncepcje i metody. dpunkt, ISBN 3-89864-177-5 .
  • Daniel Linstedt, Michael Olschimke: Tworzenie skalowalnej hurtowni danych za pomoc Data Vault 2.0 . Morgan Kaufmann, Waltham, Massachusetts 2016, ISBN 978-0-12-802510-9 .
  • Dani Schnider, Claus Jordan i inni: plany hurtowni danych. Business Intelligence w praktyce . Hanser, Monachium 2016, ISBN 978-3-446-45075-2 .
  • Reinhard Schütte: Podrcznik zarzdzania hurtowni danych. Koncepcje, oprogramowanie, dowiadczenia. Springer, ISBN 3-540-67561-2 .
  • J.-H. Wieken: Droga do hurtowni danych. Addison-Wesley, ISBN 978-3-8273-1560-1 .

Indywidualne dowody

  1. Erhard Rahm: Hurtownie danych. (PDF) Wprowadzenie. Str. 2 , dostp 29 wrzenia 2015 (notatki z wykadów, Uniwersytet w Lipsku).
  2. ^ Barry Devlin: hurtownia danych. Od architektury do realizacji . Addison-Wesley, ISBN 0-201-96425-2 .
  3. P. Mertens i in.: Podstawy informatyki biznesowej . Wydanie 5. Springer Verlag, Berlin 1998, s. 72 .
  4. William H. Inmon: Budowanie hurtowni danych. John Wiley & Sons, 1996, ISBN 978-0-471-14161-7 , strona 33
  5. a b Andreas Bauer, Holger Günzel: Systemy hurtowni danych: architektura, programowanie , aplikacje. dpunkt, 2013, ISBN 3-89864-785-4
  6. ^ A b Ralph Kimball, Mary Ross: The Data Warehouse Toolkit. Kompletny przewodnik po modelowaniu wymiarowym. Wiley, ISBN 0-471-20024-7
  7. Thomas Zeh: Hurtownie danych jako koncepcja organizacyjna zarzdzania danymi. Krytyczne spojrzenie na definicj hurtowni danych firmy Inmon. W: Informatyka - Badania i Rozwój. 18, nr 1, 2003.

Opiniones de nuestros usuarios

Dawid Biernacki

Świetny post o Hurtownia danych.

Borys Kaczyński

Dzięki za ten post na Hurtownia danych, właśnie tego potrzebowałem

Bernard Grzyb

Język wygląda na stary, ale informacje są wiarygodne i ogólnie wszystko, co napisano o Hurtownia danych, daje dużo pewności.