Tietotiede
Mitä datatiede on?
Datatiede on soveltavan matematiikan ja tilastotieteen ala,. joka tarjoaa hyödyllistä tietoa, joka perustuu suuriin määriin monimutkaista dataa tai big dataa.
Datatiede tai datavetoinen tiede yhdistää eri alojen näkökulmia laskennan avulla datariitojen tulkitsemiseksi päätöksentekoa varten.
Tietotieteen ymmärtäminen
Tietoja kerätään eri sektoreilta, kanavilta ja alustoilta, mukaan lukien matkapuhelimet, sosiaalinen media, verkkokauppasivustot, terveydenhuollon kyselyt ja Internet-haut. Käytettävissä olevan datan määrän kasvu avasi oven uudelle tutkimusalalle, joka perustuu big dataan – massiivisiin tietokokonaisuuksiin, jotka auttavat luomaan parempia toimintatyökaluja kaikilla sektoreilla.
Jatkuvasti lisääntyvä pääsy tietoihin on mahdollista tekniikan ja keräystekniikoiden edistymisen ansiosta. Yksilöiden ostotottumuksia ja -käyttäytymistä voidaan seurata ja kerättyjen tietojen perusteella tehdä ennusteita.
Yhä lisääntyvä data on kuitenkin jäsentämätöntä ja vaatii jäsentämistä tehokkaan päätöksenteon vuoksi. Tämä prosessi on monimutkainen ja aikaa vievä yrityksille – tästä syystä datatieteen ilmaantuminen.
Tietotieteen tarkoitus
Datatiede tai datalähtöinen tiede käyttää big dataa ja koneoppimista tulkitsemaan dataa päätöksentekotarkoituksiin.
Datatieteen lyhyt historia
Termi "datatiede" on ollut käytössä 1960-luvun alusta lähtien, jolloin sitä käytettiin synonyyminä "tietokonetieteen" kanssa. Myöhemmin termi erotettiin määrittämään useissa eri sovelluksissa käytettyjen tietojenkäsittelymenetelmien tutkimusta.
Vuonna 2001 William S. Cleveland käytti ensimmäistä kertaa termiä "datatiede" viittaamaan itsenäiseen tieteenalaan. Harvard Business Review julkaisi vuonna 2012 artikkelin, jossa kuvattiin datatieteilijän roolia "2000-luvun seksikkäimpana työnä".
Kuinka tietotieteitä sovelletaan
Datatiede sisältää työkaluja useilta tieteenaloilta, joiden avulla voidaan kerätä tietojoukko, käsitellä ja saada oivalluksia tietojoukosta, poimia merkityksellistä dataa joukosta ja tulkita sitä päätöksentekoa varten. Datatieteen alan tieteenaloja ovat kaivostoiminta, tilastot, koneoppiminen, analytiikka ja ohjelmointi.
Tiedonlouhinta käyttää algoritmeja monimutkaiseen tietojoukkoon paljastaakseen kuvioita, joita sitten käytetään hyödyllisten ja olennaisten tietojen poimimiseen joukosta. Tilastolliset mittaukset tai ennakoiva analytiikka käyttävät näitä poimittuja tietoja arvioidakseen tapahtumia, jotka todennäköisesti tapahtuvat tulevaisuudessa sen perusteella, mitä data näyttää tapahtuneen menneisyydessä.
Koneoppiminen on tekoälytyökalu, joka käsittelee massaa dataa, jota ihminen ei pystyisi käsittelemään elinaikanaan. Koneoppiminen täydentää ennakoivan analytiikan alla esitettyä päätösmallia sovittamalla tapahtuman todennäköisyyden siihen, mitä todellisuudessa tapahtui ennustettuna ajankohtana.
Analytiikan avulla dataanalyytikko kerää ja käsittelee strukturoitua dataa koneoppimisvaiheesta algoritmien avulla. Analyytikko tulkitsee, muuntaa ja tiivistää tiedot yhtenäiseksi kieleksi, jota päätöksentekotiimi ymmärtää. Datatiedettä sovelletaan käytännössä kaikkiin yhteyksiin ja datatieteilijän roolin kehittyessä ala laajenee kattamaan tietoarkkitehtuurin, tietotekniikan ja tiedonhallinnan.
Nopea tosiasia
Yhdysvaltain työtilastotoimiston mukaan tietokone- ja informaatiotutkimuksen tutkijoiden kysynnän odotetaan kasvavan 15 % vuodesta 2019 vuoteen 2029, paljon nopeammin kuin muissa ammateissa.
Tietotieteilijät
Datatieteilijä kerää, analysoi ja tulkitsee suuria määriä dataa, monissa tapauksissa parantaakseen yrityksen toimintaa. Tietojen tutkijat kehittävät tilastollisia malleja, jotka analysoivat dataa ja havaitsevat kuvioita, trendejä ja suhteita tietojoukoissa. Näitä tietoja voidaan käyttää ennakoimaan kuluttajien käyttäytymistä tai tunnistamaan liiketoiminta- ja operatiivisia riskejä.
Tietotutkijan rooli on usein tarinankertoja, joka esittää datan oivalluksia päättäjille ymmärrettävällä ja ongelmanratkaisuun soveltuvalla tavalla.
Tietotiede tänään
Yritykset soveltavat big dataa ja datatiedettä jokapäiväiseen toimintaan tuodakseen lisäarvoa kuluttajille. Pankkilaitokset hyödyntävät big dataa parantaakseen petosten havaitsemisen menestystä. Varainhoitoyritykset käyttävät big dataa ennustaakseen arvopaperin hinnan nousun tai laskun todennäköisyyttä tiettynä aikana.
Yritykset, kuten Netflix, louhivat big dataa määrittääkseen, mitä tuotteita toimittavat käyttäjilleen. Netflix käyttää myös algoritmeja luodakseen henkilökohtaisia suosituksia käyttäjille heidän katseluhistoriansa perusteella. Datatiede kehittyy nopeasti, ja sen sovellukset muuttavat elämää tulevaisuudessakin.
Kohokohdat
Tietotiede käyttää koneoppimisen ja tekoälyn kaltaisia tekniikoita merkityksellisen tiedon poimimiseen ja tulevien mallien ja käyttäytymisen ennustamiseen.
Datatieteen ala kasvaa tekniikan kehittyessä ja big datan keruu- ja analysointitekniikoiden kehittyessä.
Tekniikan kehitys, internet, sosiaalinen media ja teknologian käyttö ovat kaikki lisänneet big datan saatavuutta.
UKK
Mitkä ovat datatieteen huonot puolet?
Tiedonlouhinta ja sosiaalisen median yritysten pyrkimykset kaupallistaa henkilötietoja ovat joutuneet arvostelun kohteeksi useiden skandaalien valossa, kuten Cambridge Analytica,. jossa datatieteilijät käyttivät henkilötietoja vaikuttaakseen poliittisiin tuloksiin tai heikentääkseen vaaleja.
Mihin tietotieteestä on hyötyä?
Datatiede voi tunnistaa kuvioita, jotka mahdollistavat päätelmien ja ennusteiden tekemisen näennäisesti jäsentämättömästä tai asiaankuulumattomasta tiedosta. Tekniikkayritykset, jotka keräävät käyttäjätietoja, voivat käyttää tekniikoita muuttaakseen kerätyn hyödyllisen tai kannattavan tiedon lähteiksi.
Eivätkö kaikki tieteet käytä dataa?
Kyllä, kaikki empiiriset tieteet keräävät ja analysoivat dataa. Datatieteen erottaa se, että se on erikoistunut käyttämään kehittyneitä laskentamenetelmiä ja koneoppimistekniikoita suurten datajoukkojen käsittelyssä ja analysoinnissa. Usein nämä tietojoukot ovat niin suuria tai monimutkaisia, että niitä ei voida kunnolla analysoida perinteisillä menetelmillä.