Investor's wiki

Data warehousing

Data warehousing

Hvad er data warehousing?

Data warehousing er sikker elektronisk lagring af information af en virksomhed eller anden organisation. Målet med data warehousing er at skabe en skare af historiske data, der kan hentes og analyseres for at give nyttig indsigt i organisationens drift.

Data warehousing er en vital komponent i business intelligence. Det bredere udtryk omfatter den informationsinfrastruktur, som moderne virksomheder bruger til at spore deres tidligere succeser og fiaskoer og informere om deres beslutninger for fremtiden.

  • Data warehousing er opbevaring af information over tid af en virksomhed eller anden organisation.
  • Nye data tilføjes med jævne mellemrum af personer i forskellige nøgleafdelinger såsom marketing og salg.
  • Lageret bliver et bibliotek af historiske data, der kan hentes og analyseres for at informere beslutningstagning i virksomheden.
  • Nøglefaktorerne i opbygningen af et effektivt datavarehus inkluderer at definere den information, der er kritisk for organisationen, og at identificere kilderne til informationen.
  • En database er designet til at levere information i realtid. Et datavarehus er designet som et arkiv af historisk information.

Hvordan Data Warehousing fungerer

Behovet for at lagre data udviklede sig, efterhånden som virksomheder begyndte at stole på computersystemer til at oprette, arkivere og hente vigtige forretningsdokumenter. Begrebet data warehousing blev introduceret i 1988 af IBM-forskerne Barry Devlin og Paul Murphy.

Data warehousing er designet til at muliggøre analyse af historiske data. Sammenligning af data konsolideret fra flere heterogene kilder kan give indsigt i en virksomheds præstation. Et datavarehus er designet til at give dets brugere mulighed for at køre forespørgsler og analyser på historiske data, der stammer fra transaktionskilder.

Data tilføjet til lageret ændres ikke og kan ikke ændres. Lageret er den kilde, der bruges til at køre analyser på tidligere begivenheder, med fokus på ændringer over tid. Oplagrede data skal opbevares på en måde, der er sikker, pålidelig, nem at hente og nem at administrere.

Vedligeholdelse af datavarehuset

Der er visse trin, der tages for at vedligeholde et datavarehus. Et trin er dataudtræk, som involverer indsamling af store mængder data fra flere kildepunkter. Efter at et sæt data er blevet kompileret, gennemgår det datarensning, processen med at gennemsøge det for fejl og rette eller udelukke de fundne.

De oprensede data konverteres derefter fra et databaseformat til et lagerformat. Når de er lagret på lageret, gennemgår dataene sortering, konsolidering og opsummering, så de bliver nemmere at bruge. Med tiden tilføjes flere data til lageret, efterhånden som de forskellige datakilder opdateres.

En nøglebog om data warehousing er WH Inmons "Building the Data Warehouse", en praktisk vejledning, der først blev udgivet i 1990 og er blevet genoptrykt flere gange.

I dag kan virksomheder investere i cloud-baserede datavarehussoftwaretjenester fra blandt andet Microsoft, Google, Amazon og Oracle.

Data Mining

Virksomheders lagerdata primært til datamining. Det indebærer at lede efter informationsmønstre, der vil hjælpe dem med at forbedre deres forretningsprocesser.

Et godt data warehousing system gør det nemmere for forskellige afdelinger i en virksomhed at få adgang til hinandens data. For eksempel kan et marketingteam vurdere salgsteamets data for at træffe beslutninger om, hvordan de skal justere deres salgskampagner.

De 5 trin i Data Mining

Data mining-processen opdeles i fem trin:

  1. En organisation indsamler data og indlæser dem i et datavarehus.

  2. Dataene gemmes og administreres, enten på interne servere eller i en cloud-tjeneste.

  3. Forretningsanalytikere, ledelsesteams og IT-professionelle får adgang til og organiserer dataene.

  4. Applikationssoftware sorterer dataene.

  5. Slutbrugeren præsenterer dataene i et format, der er let at dele, såsom en graf eller tabel.

Konceptet med datavarehuset blev introduceret af to IBM-forskere i 1988.

Data Warehousing vs. Databaser

Et datavarehus er ikke det samme som en database:

  • En database er et transaktionssystem, der overvåger og opdaterer realtidsdata for kun at have de nyeste data tilgængelige.

  • Et datavarehus er programmeret til at aggregere strukturerede data over tid.

For eksempel kan en database kun have den seneste adresse på en kunde, mens et datavarehus måske har alle adresser til kunden i de seneste 10 år.

Data mining er afhængig af datavarehuset. Dataene på lageret sigtes for indsigt i forretningen over tid.

Fordele og ulemper ved datavarehuse

Data warehousing har til formål at give en virksomhed en konkurrencefordel. Det skaber en ressource af relevant information, som kan spores over tid og analyseres for at hjælpe en virksomhed med at træffe mere informerede beslutninger.

Det kan også dræne virksomhedens ressourcer og belaste dets nuværende personale med rutineopgaver beregnet til at fodre lagermaskinen.

Corporate Finance Institute identificerer disse potentielle ulemper ved at vedligeholde et datavarehus:

  • Det kræver en del tid og kræfter at skabe og vedligeholde lageret.

  • Huller i information, forårsaget af menneskelige fejl, kan tage år at dukke op, hvilket skader informationernes integritet og anvendelighed.

  • Når der bruges flere kilder, kan uoverensstemmelser mellem dem forårsage tab af information.

TTT

Ofte stillede spørgsmål om datavarehus

Her er svarene på nogle ofte stillede spørgsmål om data warehousing.

Hvad er et datavarehus, og hvad bruges det til?

Et datavarehus er et informationslagringssystem til historiske data, der kan analyseres på mange måder. Virksomheder og andre organisationer trækker på datavarehuset for at få indsigt i tidligere resultater og planlægge forbedringer af deres drift.

Hvad er et datavarehuseksempel?

Overvej et firma, der laver træningsudstyr. Dens bestseller er en stationær cykel, og den overvejer at udvide sin serie og lancere en ny marketingkampagne for at støtte den.

Det går til sit datavarehus for at forstå sin nuværende kunde bedre. Den kan finde ud af, om dens kunder overvejende er kvinder over 50 eller mænd under 35. Den kan lære mere om de forhandlere, der har haft størst succes med at sælge deres cykler, og hvor de befinder sig. Det kan muligvis få adgang til interne undersøgelsesresultater og finde ud af, hvad deres tidligere kunder har kunnet lide og ikke kunne lide ved deres produkter.

Alle disse oplysninger hjælper virksomheden med at beslutte, hvilken slags ny model cykler de vil bygge, og hvordan de vil markedsføre og reklamere for dem. Det er hård information snarere end buksesædet beslutningstagning.

Hvad er stadierne af data warehousing?

Der er mindst syv stadier i oprettelsen af et datavarehus, ifølge ITPro Today, en branchepublikation. De omfatter:

  • Fastlæggelse af forretningsmålene og dets centrale præstationsindikatorer.

  • Indsamling og analyse af relevante oplysninger.

  • Identifikation af de kerneforretningsprocesser, der bidrager med nøgledata.

  • Konstruktion af en konceptuel datamodel, der viser, hvordan dataene vises for slutbrugeren.

  • Lokalisering af datakilderne og etablering af en proces til indføring af data på lageret.

  • Etabler en sporingsvarighed. Datavarehuse kan blive uhåndterlige. Mange er bygget med niveauer af arkivering, så ældre information bevares i mindre detaljer.

  • Implementering af planen.

Er SQL et datavarehus?

SQL, eller Structured Query Language, er et computersprog, der bruges til at interagere med en database på vilkår, som den kan forstå og reagere på. Den indeholder en række kommandoer såsom "vælg", "indsæt" og "opdater". Det er standardsproget for relationelle databasestyringssystemer.

En database er ikke det samme som et datavarehus, selvom begge er lagre af information. En database er en organiseret samling af information. Et datavarehus er et informationsarkiv, der løbende bygges fra flere kilder.

Bundlinjen

Datavarehuset er en virksomheds lager af information om dens forretning, og hvordan den har klaret sig over tid. Skabt med input fra medarbejdere i hver af dens nøgleafdelinger, det er kilden til analyse, der afslører virksomhedens tidligere succeser og fiaskoer og informerer dens beslutningstagning.