Investor's wiki

Magazyn danych

Magazyn danych

Co to jest hurtownia danych?

Magazynowanie danych to bezpieczne elektroniczne przechowywanie informacji przez firmę lub inną organizację. Celem hurtowni danych jest stworzenie skarbnicy danych historycznych, które można wyszukiwać i analizować, aby zapewnić przydatny wgląd w działalność organizacji.

Hurtownia danych jest istotnym elementem analizy biznesowej. Ten szerszy termin obejmuje infrastrukturę informacyjną, której współczesne przedsiębiorstwa wykorzystują do śledzenia swoich przeszłych sukcesów i porażek oraz podejmowania decyzji na przyszłość.

  • Magazynowanie danych to przechowywanie informacji w czasie przez firmę lub inną organizację.
  • Nowe dane są okresowo dodawane przez osoby z różnych kluczowych działów, takich jak marketing i sprzedaż.
  • Hurtownia staje się biblioteką danych historycznych, które można wyszukiwać i analizować w celu informowania o procesie decyzyjnym w firmie.
  • Kluczowymi czynnikami w budowaniu efektywnej hurtowni danych jest zdefiniowanie informacji, które są krytyczne dla organizacji oraz identyfikacja źródeł informacji.
  • Baza danych jest przeznaczona do dostarczania informacji w czasie rzeczywistym. Hurtownia danych została zaprojektowana jako archiwum informacji historycznych.

Jak działa hurtownia danych

Potrzeba magazynowania danych ewoluowała, gdy firmy zaczęły polegać na systemach komputerowych do tworzenia, archiwizowania i pobierania ważnych dokumentów biznesowych. Pojęcie hurtowni danych zostało wprowadzone w 1988 roku przez badaczy IBM Barry'ego Devlina i Paula Murphy'ego.

Hurtownia danych ma na celu umożliwienie analizy danych historycznych. Porównanie skonsolidowanych danych z wielu heterogenicznych źródeł może zapewnić wgląd w wyniki firmy. Hurtownia danych została zaprojektowana tak, aby umożliwić jej użytkownikom wykonywanie zapytań i analiz na danych historycznych pochodzących ze źródeł transakcyjnych.

Dane dodane do hurtowni nie ulegają zmianie i nie można ich zmienić. Magazyn jest źródłem używanym do przeprowadzania analiz przeszłych zdarzeń, z naciskiem na zmiany w czasie. Przechowywane dane muszą być przechowywane w sposób bezpieczny, niezawodny, łatwy do odzyskania i łatwy w zarządzaniu.

Utrzymanie hurtowni danych

Istnieją pewne kroki, które są podejmowane w celu utrzymania hurtowni danych. Jednym z kroków jest ekstrakcja danych, która polega na gromadzeniu dużych ilości danych z wielu punktów źródłowych. Po skompilowaniu zestawu danych przechodzi on przez czyszczenie danych, proces przeczesywania go w poszukiwaniu błędów i poprawiania lub wykluczania tych, które zostały znalezione.

Oczyszczone dane są następnie konwertowane z formatu bazy danych na format magazynu. Przechowywane w magazynie dane przechodzą przez sortowanie, konsolidację i podsumowywanie, dzięki czemu łatwiej będzie z nich korzystać. Z biegiem czasu do hurtowni dodawanych jest więcej danych, gdy różne źródła danych są aktualizowane.

Kluczową książką na temat hurtowni danych jest „Budowanie hurtowni danych” firmy WH Inmon, praktyczny przewodnik, który został opublikowany po raz pierwszy w 1990 r. i był wielokrotnie przedrukowywany.

Obecnie firmy mogą inwestować w oparte na chmurze usługi oprogramowania do hurtowni danych od takich firm, jak między innymi Microsoft, Google, Amazon i Oracle.

Eksploracja danych

Firmy przechowują dane głównie do eksploracji danych. Wiąże się to z poszukiwaniem wzorców informacji, które pomogą im usprawnić ich procesy biznesowe.

Dobry system hurtowni danych ułatwia różnym działom w firmie wzajemny dostęp do danych. Na przykład zespół marketingowy może ocenić dane zespołu sprzedaży w celu podjęcia decyzji o tym, jak dostosować swoje kampanie sprzedażowe.

5 kroków eksploracji danych

Proces eksploracji danych dzieli się na pięć kroków:

  1. Organizacja zbiera dane i ładuje je do hurtowni danych.

  2. Dane są następnie przechowywane i zarządzane na wewnętrznych serwerach lub w usłudze w chmurze.

  3. Analitycy biznesowi, zespoły zarządzające i specjaliści ds. technologii informatycznych uzyskują dostęp do danych i organizują je.

  4. Oprogramowanie aplikacyjne sortuje dane.

  5. Użytkownik końcowy przedstawia dane w łatwym do udostępniania formacie, takim jak wykres lub tabela.

Koncepcja hurtowni danych została wprowadzona przez dwóch badaczy IBM w 1988 roku.

Magazynowanie danych a bazy danych

Hurtownia danych to nie to samo co baza danych:

  • Baza danych to system transakcyjny, który monitoruje i aktualizuje dane w czasie rzeczywistym, aby mieć dostęp tylko do najnowszych danych.

  • Hurtownia danych jest zaprogramowana do agregowania uporządkowanych danych w czasie.

Na przykład baza danych może zawierać tylko najnowszy adres klienta, podczas gdy hurtownia danych może zawierać wszystkie adresy klienta z ostatnich 10 lat.

Eksploracja danych opiera się na hurtowni danych. Dane w hurtowni są przeszukiwane w celu uzyskania wglądu w biznes w czasie.

Zalety i wady hurtowni danych

Hurtownia danych ma na celu zapewnienie firmie przewagi konkurencyjnej. Tworzy zasób istotnych informacji, które można śledzić w czasie i analizować, aby pomóc firmie w podejmowaniu bardziej świadomych decyzji.

Może też wyczerpywać zasoby firmy i obciążać jej obecnych pracowników rutynowymi zadaniami mającymi na celu zasilenie maszyny magazynowej.

Corporate Finance Institute identyfikuje te potencjalne wady prowadzenia hurtowni danych:

  • Stworzenie i utrzymanie magazynu zajmuje dużo czasu i wysiłku.

  • Luki w informacjach, spowodowane błędem człowieka, mogą pojawiać się latami, niszcząc integralność i użyteczność informacji.

  • W przypadku korzystania z wielu źródeł niespójności między nimi mogą spowodować utratę informacji.

TTT

Najczęściej zadawane pytania dotyczące hurtowni danych

Oto odpowiedzi na często zadawane pytania dotyczące hurtowni danych.

Co to jest hurtownia danych i do czego służy?

Hurtownia danych to system przechowywania informacji dla danych historycznych, które można analizować na wiele sposobów. Firmy i inne organizacje korzystają z hurtowni danych, aby uzyskać wgląd w wyniki w przeszłości i planować ulepszenia swoich operacji.

Co to jest przykład hurtowni danych?

Pomyśl o firmie, która produkuje sprzęt do ćwiczeń. Jej bestsellerem jest rower stacjonarny i rozważa rozszerzenie swojej linii i uruchomienie nowej kampanii marketingowej, która ma go wesprzeć.

Udaje się do swojej hurtowni danych, aby lepiej zrozumieć swojego obecnego klienta. Może dowiedzieć się, czy jej klientami są głównie kobiety powyżej 50 roku życia, czy mężczyźni poniżej 35 roku życia. Może dowiedzieć się więcej o sprzedawcach, którzy odnieśli największe sukcesy w sprzedaży swoich rowerów, oraz o ich lokalizacji. Może być w stanie uzyskać dostęp do wyników wewnętrznych ankiet i dowiedzieć się, co ich dawni klienci lubili, a czego nie lubili w ich produktach.

Wszystkie te informacje pomagają firmie zdecydować, jakie nowe modele rowerów chcą budować oraz w jaki sposób będą je sprzedawać i reklamować. To raczej twarda informacja niż podejmowanie decyzji.

Jakie są etapy hurtowni danych?

Według branżowej publikacji ITPro Today, istnieje co najmniej siedem etapów tworzenia hurtowni danych. Zawierają:

  • Ustalenie celów biznesowych i kluczowych wskaźników efektywności.

  • Zbieranie i analizowanie odpowiednich informacji.

  • Identyfikacja podstawowych procesów biznesowych, które wnoszą kluczowe dane.

  • Konstruowanie koncepcyjnego modelu danych, który pokazuje, w jaki sposób dane są wyświetlane użytkownikowi końcowemu.

  • Zlokalizowanie źródeł danych i ustanowienie procesu wprowadzania danych do hurtowni.

  • Ustal czas trwania śledzenia. Hurtownie danych mogą stać się nieporęczne. Wiele z nich jest zbudowanych z poziomami archiwizacji, dzięki czemu starsze informacje są zachowywane mniej szczegółowo.

  • Wdrażanie planu.

Czy SQL jest hurtownią danych?

SQL lub Structured Query Language to język komputerowy używany do interakcji z bazą danych w sposób, który może zrozumieć i na który odpowiada. Zawiera szereg poleceń, takich jak „wybierz”, „wstaw” i „aktualizuj”. Jest to standardowy język systemów zarządzania relacyjnymi bazami danych.

Baza danych to nie to samo co hurtownia danych, chociaż obie są magazynami informacji. Baza danych to zorganizowany zbiór informacji. Hurtownia danych to archiwum informacji, które jest stale budowane z wielu źródeł.

Podsumowanie

Hurtownia danych to repozytorium informacji firmy o jej działalności i jej wynikach w czasie. Stworzony przy udziale pracowników w każdym z kluczowych działów, jest źródłem analiz, które ujawniają przeszłe sukcesy i porażki firmy oraz informują o podejmowanych przez nią decyzjach.