Investor's wiki

Datavarehus

Datavarehus

Hva er datavarehus?

Datavarehus er sikker elektronisk lagring av informasjon av en bedrift eller annen organisasjon. Målet med datavarehus er å skape en haug med historiske data som kan hentes og analyseres for å gi nyttig innsikt i organisasjonens drift.

Datavarehus er en viktig komponent i forretningsintelligens. Dette bredere begrepet omfatter informasjonsinfrastrukturen som moderne bedrifter bruker for å spore sine tidligere suksesser og fiaskoer og informere om beslutninger for fremtiden.

  • Datavarehus er lagring av informasjon over tid av en bedrift eller annen organisasjon.
  • Nye data legges med jevne mellomrom av personer i ulike nøkkelavdelinger som markedsføring og salg.
  • Lageret blir et bibliotek av historiske data som kan hentes og analyseres for å informere beslutningstaking i virksomheten.
  • Nøkkelfaktorene for å bygge et effektivt datavarehus inkluderer å definere informasjonen som er kritisk for organisasjonen og identifisere kildene til informasjonen.
  • En database er designet for å levere sanntidsinformasjon. Et datavarehus er utformet som et arkiv med historisk informasjon.

Hvordan datavarehus fungerer

Behovet for å lagre data utviklet seg etter hvert som bedrifter begynte å stole på datasystemer for å opprette, arkivere og hente viktige forretningsdokumenter. Konseptet med datavarehus ble introdusert i 1988 av IBM-forskerne Barry Devlin og Paul Murphy.

Datavarehus er designet for å muliggjøre analyse av historiske data. Sammenligning av data konsolidert fra flere heterogene kilder kan gi innsikt i ytelsen til et selskap. Et datavarehus er designet for å tillate brukerne å kjøre spørringer og analyser på historiske data hentet fra transaksjonskilder.

Data lagt til lageret endres ikke og kan ikke endres. Lageret er kilden som brukes til å kjøre analyser på tidligere hendelser, med fokus på endringer over tid. Lagret data må lagres på en måte som er sikker, pålitelig, enkel å hente og enkel å administrere.

Vedlikehold av datavarehuset

Det er visse skritt som tas for å vedlikeholde et datavarehus. Ett trinn er datautvinning, som innebærer å samle inn store mengder data fra flere kildepunkter. Etter at et sett med data er kompilert, går det gjennom datarensing, prosessen med å finkjemme det for feil og korrigere eller ekskludere alle som blir funnet.

De ryddede dataene konverteres deretter fra et databaseformat til et lagerformat. Når de er lagret på lageret, går dataene gjennom sortering, konsolidering og oppsummering, slik at de blir enklere å bruke. Over tid legges mer data til lageret etter hvert som de ulike datakildene oppdateres.

En nøkkelbok om datavarehus er WH Inmons «Building the Data Warehouse», en praktisk veiledning som først ble utgitt i 1990 og har blitt trykt på nytt flere ganger.

I dag kan bedrifter investere i skybaserte datavarehusprogramvaretjenester fra blant annet Microsoft, Google, Amazon og Oracle.

Datautvinning

Bedrifters lagerdata primært for datautvinning. Det innebærer å lete etter informasjonsmønstre som vil hjelpe dem å forbedre forretningsprosessene sine.

Et godt datavarehus gjør det lettere for ulike avdelinger i en bedrift å få tilgang til hverandres data. Et markedsføringsteam kan for eksempel vurdere salgsteamets data for å ta beslutninger om hvordan de skal justere salgskampanjene sine.

De 5 trinnene for datautvinning

Data mining-prosessen deles inn i fem trinn:

  1. En organisasjon samler inn data og laster dem inn i et datavarehus.

  2. Dataene lagres og administreres, enten på interne servere eller i en skytjeneste.

  3. Forretningsanalytikere, ledergrupper og fagfolk innen informasjonsteknologi får tilgang til og organiserer dataene.

  4. Programvare sorterer dataene.

  5. Sluttbrukeren presenterer dataene i et format som er enkelt å dele, for eksempel en graf eller tabell.

Konseptet med datavarehuset ble introdusert av to IBM-forskere i 1988.

Datavarehus vs. databaser

Et datavarehus er ikke det samme som en database:

– En database er et transaksjonssystem som overvåker og oppdaterer sanntidsdata for å kun ha de nyeste dataene tilgjengelig.

– Et datavarehus er programmert til å samle strukturerte data over tid.

For eksempel kan en database bare ha den nyeste adressen til en kunde, mens et datavarehus kan ha alle adressene til kunden de siste 10 årene.

Datautvinning er avhengig av datavarehuset. Dataene på lageret siktes for innsikt i virksomheten over tid.

Fordeler og ulemper med datavarehus

Datavarehus er ment å gi en bedrift et konkurransefortrinn. Det skaper en ressurs med relevant informasjon som kan spores over tid og analyseres for å hjelpe en bedrift med å ta mer informerte beslutninger.

Det kan også tappe selskapets ressurser og belaste det nåværende personalet med rutineoppgaver beregnet på å mate lagermaskinen.

Corporate Finance Institute identifiserer disse potensielle ulempene ved å vedlikeholde et datavarehus:

– Det tar mye tid og krefter å lage og vedlikeholde lageret.

– Det kan ta år før huller i informasjon, forårsaket av menneskelige feil, dukker opp, og skader integriteten og nytten av informasjonen.

  • Når flere kilder brukes, kan inkonsekvenser mellom dem føre til tap av informasjon.
TTT

Vanlige spørsmål om datavarehus

Her er svarene på noen vanlige spørsmål om datavarehus.

Hva er et datavarehus og hva brukes det til?

Et datavarehus er et informasjonslagringssystem for historiske data som kan analyseres på mange måter. Bedrifter og andre organisasjoner bruker datavarehuset for å få innsikt i tidligere ytelse og planlegge forbedringer av driften.

Hva er et datavarehuseksempel?

Vurder et selskap som lager treningsutstyr. Bestselgeren er en stasjonær sykkel, og den vurderer å utvide serien og lansere en ny markedsføringskampanje for å støtte den.

Den går til datavarehuset for å forstå den nåværende kunden bedre. Den kan finne ut om kundene hovedsakelig er kvinner over 50 eller menn under 35. Den kan lære mer om forhandlerne som har hatt størst suksess med å selge syklene sine, og hvor de befinner seg. Den kan kanskje få tilgang til interne undersøkelsesresultater og finne ut hva deres tidligere kunder har likt og mislikt med produktene deres.

All denne informasjonen hjelper selskapet med å bestemme hva slags ny modell sykler de vil bygge og hvordan de vil markedsføre og annonsere dem. Det er vanskelig informasjon i stedet for å ta beslutninger.

Hva er stadier av datavarehus?

Det er minst syv stadier i etableringen av et datavarehus, ifølge ITPro Today, en bransjepublikasjon. De inkluderer:

  • Fastsettelse av forretningsmål og nøkkelindikatorer.

  • Samle inn og analysere riktig informasjon.

  • Identifisere kjernevirksomhetsprosessene som bidrar med nøkkeldata.

  • Konstruere en konseptuell datamodell som viser hvordan dataene vises til sluttbrukeren.

  • Lokalisere kildene til dataene og etablere en prosess for innmating av data til lageret.

  • Etabler en sporingsvarighet. Datavarehus kan bli uhåndterlig. Mange er bygget med nivåer av arkivering, slik at eldre informasjon beholdes i mindre detalj.

  • Gjennomføring av planen.

Er SQL et datavarehus?

SQL, eller Structured Query Language, er et dataspråk som brukes til å samhandle med en database på vilkår som den kan forstå og svare på. Den inneholder en rekke kommandoer som "velg", "sett inn" og "oppdater". Det er standardspråket for administrasjonssystemer for relasjonsdatabaser.

En database er ikke det samme som et datavarehus, selv om begge er lagre av informasjon. En database er en organisert samling av informasjon. Et datavarehus er et informasjonsarkiv som kontinuerlig bygges fra flere kilder.

Bunnlinjen

Datavarehuset er et selskaps arkiv med informasjon om virksomheten og hvordan den har prestert over tid. Laget med innspill fra ansatte i hver av nøkkelavdelingene, er det kilden for analyse som avslører selskapets tidligere suksesser og fiaskoer og informerer om beslutningstaking.