Investor's wiki

Datenspeicherung

Datenspeicherung

Was ist Data Warehousing?

Data Warehousing ist die sichere elektronische Speicherung von Informationen durch ein Unternehmen oder eine andere Organisation. Das Ziel von Data Warehousing besteht darin, eine Fundgrube historischer Daten zu erstellen, die abgerufen und analysiert werden können, um nützliche Einblicke in die Abläufe der Organisation zu erhalten.

Data Warehousing ist ein wesentlicher Bestandteil von Business Intelligence. Dieser umfassendere Begriff umfasst die Informationsinfrastruktur, die moderne Unternehmen verwenden, um ihre vergangenen Erfolge und Misserfolge zu verfolgen und ihre Entscheidungen für die Zukunft zu treffen.

  • Data Warehousing ist die langfristige Speicherung von Informationen durch ein Unternehmen oder eine andere Organisation.
  • Neue Daten werden regelmäßig von Personen in verschiedenen Schlüsselabteilungen wie Marketing und Vertrieb hinzugefügt.
  • Das Lager wird zu einer Bibliothek historischer Daten, die abgerufen und analysiert werden können, um die Entscheidungsfindung im Unternehmen zu unterstützen.
  • Zu den Schlüsselfaktoren beim Aufbau eines effektiven Data Warehouse gehören die Definition der Informationen, die für die Organisation entscheidend sind, und die Identifizierung der Informationsquellen.
  • Eine Datenbank soll Echtzeitinformationen liefern. Ein Data Warehouse ist als Archiv historischer Informationen konzipiert.

So funktioniert Data Warehousing

Die Notwendigkeit, Daten zu speichern, entwickelte sich, als Unternehmen begannen, sich auf Computersysteme zu verlassen, um wichtige Geschäftsdokumente zu erstellen, zu archivieren und abzurufen. Das Konzept des Data Warehousing wurde 1988 von den IBM-Forschern Barry Devlin und Paul Murphy eingeführt.

Data Warehousing soll die Analyse historischer Daten ermöglichen. Der Vergleich von Daten, die aus mehreren heterogenen Quellen konsolidiert wurden, kann einen Einblick in die Leistung eines Unternehmens geben. Ein Data Warehouse ist so konzipiert, dass seine Benutzer Abfragen und Analysen auf historischen Daten ausführen können, die aus Transaktionsquellen stammen.

Dem Warehouse hinzugefügte Daten ändern sich nicht und können nicht geändert werden. Das Warehouse ist die Quelle, die verwendet wird, um Analysen zu vergangenen Ereignissen durchzuführen, wobei der Schwerpunkt auf Änderungen im Laufe der Zeit liegt. Gespeicherte Daten müssen auf eine Weise gespeichert werden, die sicher, zuverlässig, einfach abzurufen und einfach zu verwalten ist.

Wartung des Data Warehouse

Es gibt bestimmte Schritte, die unternommen werden, um ein Data Warehouse zu pflegen. Ein Schritt ist die Datenextraktion, bei der große Datenmengen von mehreren Quellpunkten gesammelt werden. Nachdem ein Datensatz zusammengestellt wurde, durchläuft er die Datenbereinigung, den Prozess des Durchkämmens nach Fehlern und das Korrigieren oder Ausschließen gefundener Daten.

Die bereinigten Daten werden dann von einem Datenbankformat in ein Warehouse-Format konvertiert. Sobald die Daten im Lager gespeichert sind, werden sie sortiert, konsolidiert und zusammengefasst, damit sie einfacher zu verwenden sind. Im Laufe der Zeit werden dem Warehouse weitere Daten hinzugefügt, wenn die verschiedenen Datenquellen aktualisiert werden.

Ein Schlüsselbuch zum Thema Data Warehousing ist „Building the Data Warehouse“ von WH Inmon, ein praktischer Leitfaden, der erstmals 1990 veröffentlicht und mehrmals nachgedruckt wurde.

Heute können Unternehmen unter anderem in Cloud-basierte Data-Warehouse-Softwaredienste von Unternehmen wie Microsoft, Google, Amazon und Oracle investieren.

Data-Mining

Unternehmen speichern Daten hauptsächlich für Data Mining. Dazu gehört die Suche nach Informationsmustern, die ihnen helfen, ihre Geschäftsprozesse zu verbessern.

Ein gutes Data-Warehousing-System erleichtert verschiedenen Abteilungen innerhalb eines Unternehmens den gegenseitigen Zugriff auf die Daten. Beispielsweise kann ein Marketingteam die Daten des Vertriebsteams auswerten, um Entscheidungen zur Anpassung seiner Verkaufskampagnen zu treffen.

Die 5 Schritte des Data Mining

Der Data-Mining-Prozess gliedert sich in fünf Schritte:

  1. Eine Organisation sammelt Daten und lädt sie in ein Data Warehouse.

  2. Anschließend werden die Daten gespeichert und verwaltet, entweder auf hauseigenen Servern oder in einem Cloud-Service.

  3. Geschäftsanalysten, Managementteams und IT-Experten greifen auf die Daten zu und organisieren sie.

  4. Anwendungssoftware sortiert die Daten.

  5. Der Endbenutzer präsentiert die Daten in einem einfach zu teilenden Format, wie z. B. einem Diagramm oder einer Tabelle.

Das Konzept des Data Warehouse wurde 1988 von zwei IBM-Forschern eingeführt.

Data Warehousing vs. Datenbanken

Ein Data Warehouse ist nicht dasselbe wie eine Datenbank:

  • Eine Datenbank ist ein Transaktionssystem, das Echtzeitdaten überwacht und aktualisiert, um nur die neuesten Daten verfügbar zu haben.

  • Ein Data Warehouse ist so programmiert, dass es strukturierte Daten im Laufe der Zeit aggregiert.

Beispielsweise enthält eine Datenbank möglicherweise nur die neueste Adresse eines Kunden, während ein Data Warehouse möglicherweise alle Adressen des Kunden der letzten 10 Jahre enthält.

Data Mining stützt sich auf das Data Warehouse. Die Daten im Lager werden gesichtet, um Einblicke in das Geschäft im Laufe der Zeit zu erhalten.

Vor- und Nachteile von Data Warehouses

Data Warehousing soll einem Unternehmen einen Wettbewerbsvorteil verschaffen. Es schafft eine Ressource relevanter Informationen, die im Laufe der Zeit verfolgt und analysiert werden können, um einem Unternehmen zu helfen, fundiertere Entscheidungen zu treffen.

Es kann auch Unternehmensressourcen erschöpfen und seine derzeitigen Mitarbeiter mit Routineaufgaben belasten, die dazu bestimmt sind, die Lagermaschine zu füttern.

Das Corporate Finance Institute identifiziert diese potenziellen Nachteile der Pflege eines Data Warehouse:

  • Es erfordert viel Zeit und Mühe, das Lager zu erstellen und zu pflegen.

  • Informationslücken, die durch menschliches Versagen verursacht werden, können Jahre dauern, bis sie auftauchen und die Integrität und Nützlichkeit der Informationen beeinträchtigen.

  • Wenn mehrere Quellen verwendet werden, können Inkonsistenzen zwischen ihnen zu Informationsverlusten führen.

TTT

Häufig gestellte Fragen zu Data Warehouse

Hier finden Sie Antworten auf einige häufig gestellte Fragen zum Thema Data Warehousing.

Was ist ein Data Warehouse und wofür wird es verwendet?

Ein Data Warehouse ist ein Informationsspeichersystem für historische Daten, die auf vielfältige Weise analysiert werden können. Unternehmen und andere Organisationen nutzen das Data Warehouse, um Einblicke in vergangene Leistungen zu erhalten und Verbesserungen ihrer Betriebsabläufe zu planen.

Was ist ein Data-Warehouse-Beispiel?

Stellen Sie sich ein Unternehmen vor, das Trainingsgeräte herstellt. Sein Bestseller ist ein stationäres Fahrrad, und es erwägt, sein Sortiment zu erweitern und eine neue Marketingkampagne zu starten, um es zu unterstützen.

Es geht in sein Data Warehouse, um seinen aktuellen Kunden besser zu verstehen. Er kann herausfinden, ob seine Kunden überwiegend Frauen über 50 oder Männer unter 35 sind. Er kann mehr über die Händler erfahren, die ihre Fahrräder am erfolgreichsten verkaufen, und wo sie sich befinden. Es kann möglicherweise auf interne Umfrageergebnisse zugreifen und herausfinden, was seinen früheren Kunden an seinen Produkten gefallen und was nicht gefallen hat.

All diese Informationen helfen dem Unternehmen bei der Entscheidung, welche Art von neuen Fahrradmodellen es bauen möchte und wie es sie vermarkten und bewerben wird. Es handelt sich eher um harte Informationen als um eine Entscheidungsfindung im Sitzen der Hose.

Was sind die Phasen des Data Warehousing?

Laut ITPro Today, einer Branchenpublikation, umfasst die Erstellung eines Data Warehouse mindestens sieben Phasen. Sie beinhalten:

  • Bestimmung der Unternehmensziele und ihrer wichtigsten Leistungsindikatoren.

  • Sammeln und Analysieren der entsprechenden Informationen.

  • Identifizierung der Kerngeschäftsprozesse, die die Schlüsseldaten beitragen.

  • Erstellen eines konzeptionellen Datenmodells, das zeigt, wie die Daten dem Endbenutzer angezeigt werden.

  • Auffinden der Datenquellen und Einrichten eines Prozesses zum Einspeisen von Daten in das Warehouse.

  • Legen Sie eine Tracking-Dauer fest. Data Warehouses können unhandlich werden. Viele sind mit Archivierungsebenen aufgebaut, sodass ältere Informationen weniger detailliert aufbewahrt werden.

  • Umsetzung des Plans.

Ist SQL ein Data Warehouse?

SQL oder Structured Query Language ist eine Computersprache, die verwendet wird, um mit einer Datenbank in einer Weise zu interagieren, die sie verstehen und auf die sie reagieren kann. Es enthält eine Reihe von Befehlen wie „Auswählen“, „Einfügen“ und „Aktualisieren“. Es ist die Standardsprache für relationale Datenbankverwaltungssysteme.

Eine Datenbank ist nicht dasselbe wie ein Data Warehouse, obwohl beide Informationsspeicher sind. Eine Datenbank ist eine organisierte Sammlung von Informationen. Ein Data Warehouse ist ein Informationsarchiv, das kontinuierlich aus mehreren Quellen aufgebaut wird.

Das Endergebnis

Das Data Warehouse ist das Informationsarchiv eines Unternehmens über sein Geschäft und seine Leistung im Laufe der Zeit. Es wurde mit Beiträgen von Mitarbeitern in allen wichtigen Abteilungen erstellt und ist die Quelle für Analysen, die die vergangenen Erfolge und Misserfolge des Unternehmens aufzeigen und seine Entscheidungsfindung informieren.