Investor's wiki

Datavidenskab

Datavidenskab

Hvad er datavidenskab?

Datavidenskab er et felt inden for anvendt matematik og statistik,. der giver nyttige oplysninger baseret på store mængder komplekse data eller big data.

Datavidenskab, eller datadrevet videnskab, kombinerer aspekter af forskellige felter ved hjælp af beregning for at fortolke mængder af data til beslutningsformål.

Forståelse af datavidenskab

Data er hentet fra forskellige sektorer, kanaler og platforme, herunder mobiltelefoner, sociale medier, e-handelssider, sundhedsundersøgelser og internetsøgninger. Stigningen i mængden af tilgængelige data åbnede døren til et nyt studiefelt baseret på big data – de massive datasæt, der bidrager til skabelsen af bedre operationelle værktøjer i alle sektorer.

Den stadigt stigende adgang til data er mulig på grund af fremskridt inden for teknologi og indsamlingsteknikker. Enkeltpersoners købsmønstre og adfærd kan overvåges og forudsigelser foretages baseret på den indsamlede information.

Imidlertid er de stadigt stigende data ustrukturerede og kræver parsing for effektiv beslutningstagning. Denne proces er kompleks og tidskrævende for virksomheder - derfor fremkomsten af datavidenskab.

Formålet med datavidenskab

Datavidenskab, eller datadrevet videnskab, bruger big data og maskinlæring til at fortolke data til beslutningsformål.

En kort historie om datavidenskab

Udtrykket "data science" har været i brug siden begyndelsen af 1960'erne, hvor det blev brugt synonymt med "datalogi". Senere blev udtrykket gjort distinkt for at definere undersøgelsen af databehandlingsmetoder, der anvendes i en række forskellige applikationer.

I 2001 brugte William S. Cleveland for første gang udtrykket "data science" til at henvise til en uafhængig disciplin. Harvard Business Review udgav en artikel i 2012, der beskrev dataforskerens rolle som "det mest sexede job i det 21. århundrede."

Hvordan datavidenskab anvendes

Datavidenskab inkorporerer værktøjer fra flere discipliner til at indsamle et datasæt, behandle og udlede indsigt fra datasættet, udtrække meningsfulde data fra sættet og fortolke det til beslutningsformål. De disciplinære områder, der udgør datavidenskabsfeltet, omfatter minedrift, statistik, maskinlæring, analyse og programmering.

Data mining anvender algoritmer til det komplekse datasæt for at afsløre mønstre, der derefter bruges til at udtrække nyttige og relevante data fra sættet. Statistiske mål eller forudsigelige analyser bruger disse udtrukne data til at måle begivenheder, der sandsynligvis vil ske i fremtiden, baseret på, hvad dataene viser, der er sket i fortiden.

Machine learning er et kunstig intelligensværktøj, der behandler massemængder af data, som et menneske ikke ville være i stand til at behandle i et helt liv. Maskinlæring perfektionerer beslutningsmodellen præsenteret under forudsigende analyse ved at matche sandsynligheden for, at en begivenhed sker, med det, der faktisk skete på et forudsagt tidspunkt.

Ved hjælp af analyser indsamler og behandler dataanalytikeren de strukturerede data fra maskinlæringsstadiet ved hjælp af algoritmer. Analytikeren fortolker, konverterer og opsummerer dataene til et sammenhængende sprog, som beslutningsteamet kan forstå. Datavidenskab anvendes til praktisk talt alle sammenhænge, og efterhånden som dataforskerens rolle udvikler sig, vil feltet udvides til at omfatte dataarkitektur, datateknik og dataadministration.

Hurtigt faktum

Efterspørgslen efter computer- og informationsforskere forventes at vokse med 15 % fra 2019 til 2029, meget hurtigere end andre erhverv, ifølge US Bureau of Labor Statistics.

Data Scientists

En dataforsker indsamler, analyserer og fortolker store mængder data, i mange tilfælde, for at forbedre en virksomheds drift. Dataforskere udvikler statistiske modeller, der analyserer data og opdager mønstre, tendenser og sammenhænge i datasæt. Disse oplysninger kan bruges til at forudsige forbrugeradfærd eller til at identificere forretningsmæssige og operationelle risici.

Data scientist-rollen er ofte en historiefortæller, der præsenterer dataindsigt til beslutningstagere på en måde, der er forståelig og anvendelig til problemløsning.

Data Science i dag

Virksomheder anvender big data og datavidenskab til hverdagsaktiviteter for at bringe værdi til forbrugerne. Bankinstitutioner udnytter big data for at forbedre deres succes med at opdage svindel. Kapitalforvaltningsfirmaer bruger big data til at forudsige sandsynligheden for, at et værdipapirs pris bevæger sig op eller ned på et angivet tidspunkt.

Virksomheder som Netflix miner big data for at bestemme, hvilke produkter de skal levere til deres brugere. Netflix bruger også algoritmer til at skabe personlige anbefalinger til brugere baseret på deres visningshistorik. Datavidenskab udvikler sig med en hastig hastighed, og dens anvendelser vil fortsætte med at ændre liv ind i fremtiden.

Højdepunkter

  • Datavidenskab bruger teknikker som maskinlæring og kunstig intelligens til at udtrække meningsfuld information og til at forudsige fremtidige mønstre og adfærd.

  • Datavidenskabsområdet vokser i takt med, at teknologien udvikler sig, og indsamlings- og analyseteknikker for store data bliver mere sofistikerede.

  • Fremskridt inden for teknologi, internettet, sociale medier og brugen af teknologi har alle øget adgangen til big data.

Ofte stillede spørgsmål

Hvad er nogle ulemper ved datavidenskab?

Data mining og bestræbelser på at varetage personlige data fra sociale medievirksomheder er blevet kritiseret i lyset af flere skandaler, såsom Cambridge Analytica,. hvor persondata blev brugt af dataforskere til at påvirke politiske resultater eller underminere valg.

Hvad er datavidenskab nyttigt til?

Datavidenskab kan identificere mønstre, der tillader slutninger og forudsigelser, fra tilsyneladende ustrukturerede eller urelaterede data. Teknikvirksomheder, der indsamler brugerdata, kan bruge teknikker til at omdanne det indsamlede til kilder til nyttig eller rentabel information.

Bruger alle videnskaber ikke data?

Ja, alle empiriske videnskaber indsamler og analyserer data. Det, der adskiller datavidenskab, er, at det er specialiseret i at bruge sofistikerede beregningsmetoder og maskinlæringsteknikker for at behandle og analysere store datasæt. Disse datasæt er ofte så store eller komplekse, at de ikke kan analyseres ordentligt ved hjælp af traditionelle metoder.