Investor's wiki

Data Warehouse

Data Warehouse

Che cos'è il data warehouse?

Il data warehousing è l'archiviazione elettronica sicura di informazioni da parte di un'azienda o di un'altra organizzazione. L'obiettivo del data warehousing è creare una raccolta di dati storici che possono essere recuperati e analizzati per fornire informazioni utili sulle operazioni dell'organizzazione.

Il data warehousing è una componente vitale della business intelligence. Quel termine più ampio comprende l'infrastruttura informativa che le aziende moderne utilizzano per tenere traccia dei loro successi e fallimenti passati e informare le loro decisioni per il futuro.

  • Il data warehousing è l'archiviazione di informazioni nel tempo da parte di un'azienda o di un'altra organizzazione.
  • Nuovi dati vengono aggiunti periodicamente da persone in vari dipartimenti chiave come marketing e vendite.
  • Il magazzino diventa una libreria di dati storici che possono essere recuperati e analizzati per informare il processo decisionale dell'azienda.
  • I fattori chiave nella costruzione di un data warehouse efficace includono la definizione delle informazioni critiche per l'organizzazione e l'identificazione delle fonti delle informazioni.
  • Un database è progettato per fornire informazioni in tempo reale. Un data warehouse è concepito come un archivio di informazioni storiche.

Come funziona il data warehouse

La necessità di archiviare i dati si è evoluta quando le aziende hanno iniziato a fare affidamento su sistemi informatici per creare, archiviare e recuperare importanti documenti aziendali. Il concetto di data warehousing è stato introdotto nel 1988 dai ricercatori IBM Barry Devlin e Paul Murphy.

Il data warehousing è progettato per consentire l'analisi dei dati storici. Il confronto di dati consolidati provenienti da più fonti eterogenee può fornire informazioni dettagliate sulle prestazioni di un'azienda. Un data warehouse è progettato per consentire ai propri utenti di eseguire query e analisi su dati storici derivati da fonti transazionali.

I dati aggiunti al magazzino non cambiano e non possono essere modificati. Il magazzino è la fonte utilizzata per eseguire analisi sugli eventi passati, con particolare attenzione ai cambiamenti nel tempo. I dati archiviati devono essere archiviati in modo sicuro, affidabile, facile da recuperare e facile da gestire.

Manutenzione del data warehouse

Ci sono alcuni passaggi che vengono presi per mantenere un data warehouse. Un passaggio è l'estrazione dei dati, che comporta la raccolta di grandi quantità di dati da più punti di origine. Dopo che un insieme di dati è stato compilato, passa attraverso la pulizia dei dati, il processo di pettinarli alla ricerca di errori e correggere o escludere quelli trovati.

I dati ripuliti vengono quindi convertiti da un formato database a un formato warehouse. Una volta archiviati nel magazzino, i dati vengono smistati, consolidati e riepilogati, in modo da renderli più facili da utilizzare. Nel tempo, vengono aggiunti più dati al magazzino man mano che le varie origini dati vengono aggiornate.

Un libro chiave sul data warehousing è "Building the Data Warehouse" di WH Inmon, una guida pratica pubblicata per la prima volta nel 1990 e ristampata più volte.

Oggi le aziende possono investire in servizi software di data warehouse basati su cloud di aziende come Microsoft, Google, Amazon e Oracle, tra le altre.

Estrazione dei dati

Le aziende immagazzinano i dati principalmente per il data mining. Ciò implica la ricerca di modelli di informazioni che li aiutino a migliorare i propri processi aziendali.

Un buon sistema di data warehousing facilita l'accesso ai dati degli altri dipartimenti all'interno di un'azienda. Ad esempio, un team di marketing può valutare i dati del team di vendita per prendere decisioni su come modificare le proprie campagne di vendita.

I 5 passaggi del data mining

Il processo di data mining si articola in cinque fasi:

  1. Un'organizzazione raccoglie i dati e li carica in un data warehouse.

  2. I dati vengono quindi archiviati e gestiti, su server interni o in un servizio cloud.

  3. Analisti aziendali, team di gestione e professionisti delle tecnologie dell'informazione accedono e organizzano i dati.

  4. Il software applicativo ordina i dati.

  5. L'utente finale presenta i dati in un formato facile da condividere, come un grafico o una tabella.

Il concetto di data warehouse è stato introdotto da due ricercatori IBM nel 1988.

Data Warehousing e database

Un data warehouse non è la stessa cosa di un database:

  • Un database è un sistema transazionale che monitora e aggiorna i dati in tempo reale per avere a disposizione solo i dati più recenti.

  • Un data warehouse è programmato per aggregare dati strutturati nel tempo.

Ad esempio, un database potrebbe avere solo l'indirizzo più recente di un cliente, mentre un data warehouse potrebbe avere tutti gli indirizzi del cliente negli ultimi 10 anni.

Il data mining si basa sul data warehouse. I dati nel magazzino vengono setacciati per ottenere informazioni dettagliate sull'attività nel tempo.

Vantaggi e svantaggi dei data warehouse

Il data warehousing ha lo scopo di fornire a un'azienda un vantaggio competitivo. Crea una risorsa di informazioni pertinenti che possono essere tracciate nel tempo e analizzate per aiutare un'azienda a prendere decisioni più informate.

Può anche prosciugare le risorse aziendali e gravare sul personale attuale con compiti di routine destinati ad alimentare la macchina del magazzino.

Il Corporate Finance Institute identifica questi potenziali svantaggi del mantenimento di un data warehouse:

  • La creazione e la manutenzione del magazzino richiedono molto tempo e sforzi.

  • Le lacune nelle informazioni, causate da errori umani, possono richiedere anni per emergere, danneggiando l'integrità e l'utilità delle informazioni.

  • Quando vengono utilizzate più fonti, le incongruenze tra di esse possono causare perdite di informazioni..

TTT

Domande frequenti sul data warehouse

Ecco le risposte ad alcune domande frequenti sul data warehousing.

Che cos'è un data warehouse e a cosa serve?

Un data warehouse è un sistema di archiviazione di informazioni per dati storici che possono essere analizzati in numerosi modi. Le aziende e altre organizzazioni attingono al data warehouse per ottenere informazioni dettagliate sulle prestazioni passate e pianificare miglioramenti alle proprie operazioni.

Che cos'è un esempio di data warehouse?

Considera un'azienda che produce attrezzature per esercizi. Il suo best-seller è una cyclette e sta valutando l'idea di ampliare la sua linea e lanciare una nuova campagna di marketing per supportarla.

Va al suo data warehouse per capire meglio il suo attuale cliente. Può scoprire se i suoi clienti sono prevalentemente donne con più di 50 anni o uomini con meno di 35 anni. Può saperne di più sui rivenditori che hanno avuto più successo nella vendita delle loro biciclette e dove si trovano. Potrebbe essere in grado di accedere ai risultati del sondaggio interno e scoprire cosa è piaciuto e cosa non è piaciuto ai loro clienti passati dei loro prodotti.

Tutte queste informazioni aiutano l'azienda a decidere che tipo di nuovo modello di bicicletta desidera costruire e come commercializzarle e pubblicizzarle. È un'informazione difficile piuttosto che un processo decisionale sul sedile dei pantaloni.

Quali sono le fasi del data warehousing?

Ci sono almeno sette fasi per la creazione di un data warehouse, secondo ITPro Today, una pubblicazione del settore. Loro includono:

  • Determinazione degli obiettivi di business e dei suoi indicatori chiave di performance.

  • Raccolta e analisi delle informazioni appropriate.

  • Identificare i processi di core business che forniscono i dati chiave.

  • Costruzione di un modello di dati concettuale che mostri come i dati vengono visualizzati all'utente finale.

  • Individuazione delle fonti dei dati e definizione di un processo per l'immissione dei dati nel magazzino.

  • Stabilire una durata di tracciamento. I data warehouse possono diventare ingombranti. Molti sono costruiti con livelli di archiviazione, in modo che le informazioni più vecchie vengano conservate con meno dettagli.

  • Implementazione del piano.

SQL è un data warehouse?

SQL, o Structured Query Language, è un linguaggio informatico utilizzato per interagire con un database in termini che può comprendere e rispondere. Contiene una serie di comandi come "seleziona", "inserisci" e "aggiorna". È il linguaggio standard per i sistemi di gestione di database relazionali.

Un database non è la stessa cosa di un data warehouse, sebbene entrambi siano archivi di informazioni. Un database è una raccolta organizzata di informazioni. Un data warehouse è un archivio di informazioni che viene continuamente costruito da più fonti.

La linea di fondo

Il data warehouse è il repository di informazioni di un'azienda sulla sua attività e sulle sue prestazioni nel tempo. Creato con il contributo dei dipendenti in ciascuno dei suoi dipartimenti chiave, è la fonte di analisi che rivela i successi ei fallimenti passati dell'azienda e ne informa il processo decisionale.