Investor's wiki

Tilastot

Tilastot

Mikä on tilastot?

Tilastot on sovelletun matematiikan haara, joka sisältää kvantitatiivisten tietojen keräämisen, kuvauksen, analyysin ja päätelmien tekemisen. Tilastojen taustalla olevat matemaattiset teoriat tukeutuvat voimakkaasti differentiaali- ja integraalilaskeluun, lineaariseen algebraan ja todennäköisyysteoriaan.

Tilastotyöntekijät, tilastotyöntekijät, ovat erityisen huolissaan siitä, miten pienten näytteiden käyttäytymisestä ja muista havaittavista ominaisuuksista voidaan tehdä luotettavia johtopäätöksiä suurista ryhmistä ja yleisistä tapahtumista. Nämä pienet näytteet edustavat osaa suuresta ryhmästä tai rajoitettua määrää yleisen ilmiön tapauksia.

Tilastojen ymmärtäminen

Tilastoja käytetään käytännössä kaikilla tieteenaloilla, kuten fysikaalisissa ja yhteiskuntatieteissä, sekä liike-elämässä, humanistisissa tieteissä, hallinnossa ja teollisuudessa. Tilastot on pohjimmiltaan soveltavan matematiikan haara, joka kehittyi matemaattisten työkalujen, mukaan lukien laskennan ja lineaarisen algebran, soveltamisesta todennäköisyysteoriaan.

Käytännössä tilastot ovat ajatus, jonka avulla voimme oppia suurten objekti- tai tapahtumajoukkojen ( populaatio ) ominaisuuksia tutkimalla pienemmän määrän samankaltaisia kohteita tai tapahtumia ( otos ). Koska monissa tapauksissa kattavien tietojen kerääminen koko väestöstä on liian kallista, vaikeaa tai täysin mahdotonta, tilastot alkavat otoksesta, jota voidaan kätevästi tai edullisesti tarkkailla.

Tietojen analysoinnissa käytetään kahdenlaisia tilastollisia menetelmiä: kuvailevaa tilastoa ja päättelytilastoa. Tilastotyöntekijät mittaavat ja keräävät tietoja yksilöistä tai otoksen osista ja analysoivat sitten nämä tiedot kuvailevien tilastojen luomiseksi. He voivat sitten käyttää näitä havaittuja näytetietojen ominaisuuksia, joita kutsutaan oikein "tilastoiksi", tehdäkseen päätelmiä tai valistuneita arvauksia laajemman populaation mittaamattomista (tai mittaamattomista) ominaisuuksista, joita kutsutaan parametreiksi.

Tilastot ovat epävirallisia vuosisatojen takaa. Varhaiset tiedot ranskalaisten matemaatikoiden Pierre de Fermat'n ja Blaise Pascalin välisestä kirjeenvaihdosta vuonna 1654 mainitaan usein varhaisena esimerkkinä tilastollisesta todennäköisyysanalyysistä.

Kuvaavia ja päätteleviä tilastoja

Tilastojen kaksi pääaluetta tunnetaan kuvaavina tilastoina, jotka kuvaavat otos- ja populaatiotietojen ominaisuuksia, ja päättelytilastot, jotka käyttävät näitä ominaisuuksia hypoteesien testaamiseen ja johtopäätösten tekemiseen. Kuvaaviin tilastoihin kuuluvat keskiarvo (keskiarvo), varianssi, vinous ja kurtoosi. Päätelmätilastot sisältävät lineaarisen regressioanalyysin,. varianssianalyysin (ANOVA), logit/probit-mallit ja nollahypoteesin testauksen.

Kuvailevia tilastoja

Kuvaava tilasto keskittyy enimmäkseen otostietojen keskeiseen suuntaukseen, vaihteluun ja jakautumiseen. Keskitrendillä tarkoitetaan ominaisuuksien arviota, tyypillistä otoksen tai populaation elementtiä, ja se sisältää kuvaavia tilastoja, kuten keskiarvo,. mediaani ja tila. Vaihtelevuus viittaa joukkoon tilastoja, jotka osoittavat, kuinka paljon eroa otoksen tai populaation elementtien välillä on mitattujen ominaisuuksien mukaan, ja sisältää mittareita, kuten vaihteluvälin,. varianssin ja keskihajonnan.

Jakauma viittaa tietojen yleiseen "muotoon" , joka voidaan kuvata kaaviossa, kuten histogrammissa tai pistekaaviossa, ja se sisältää ominaisuuksia, kuten todennäköisyysjakaumafunktion, vinouden ja kurtoosin. Kuvaavilla tilastoilla voidaan myös kuvata eroja tietojoukon elementtien havaittujen ominaisuuksien välillä. Kuvailevat tilastot auttavat ymmärtämään tietootoksen elementtien kollektiivisia ominaisuuksia ja muodostavat perustan hypoteesien testaamiselle ja ennusteiden tekemiselle päättelytilastojen avulla.

Päätelmätilastot

Päätelmätilastot ovat työkaluja, joita tilastotieteilijät käyttävät tehdäkseen johtopäätöksiä populaation ominaisuuksista otoksen ominaisuuksien perusteella ja päättääkseen, kuinka varmoja he voivat olla näiden johtopäätösten luotettavuudesta. Otoskoon ja jakauman perusteella tilastotieteilijät voivat laskea todennäköisyyden, että tilastot, jotka mittaavat keskeistä suuntausta, vaihtelevuutta, jakautumista ja ominaisuuksien välisiä suhteita tietonäytteen sisällä, antavat tarkan kuvan vastaavista parametreista koko populaatiossa, josta otos otetaan. on piirretty.

Päätelmätilastojen avulla tehdään yleistyksiä suurista ryhmistä, kuten arvioitaessa tuotteen keskimääräistä kysyntää kartoittamalla otos kuluttajien ostotottumuksista tai yritetään ennustaa tulevia tapahtumia, kuten ennustaa arvopaperi- tai omaisuusluokan tulevaa tuottoa. palautuu näytejaksolla.

Regressioanalyysi on laajalti käytetty tilastollisen päättelyn tekniikka, jota käytetään määrittämään riippuvan muuttujan ja yhden tai useamman selittävän (riippumattoman) muuttujan välisen suhteen (eli korrelaation ) vahvuus ja luonne. Regressiomallin tuotos analysoidaan usein tilastollisen merkitsevyyden suhteen,. mikä viittaa väitteeseen, jonka mukaan testauksen tai kokeilun tuloksena saatu tulos ei todennäköisesti ole sattumaa tai sattumaa, vaan se johtuu todennäköisesti tietystä syystä, jonka selvitti tiedot. Tilastollinen merkitsevyys on tärkeää akateemisille tieteenaloille tai ammatinharjoittajille, jotka luottavat voimakkaasti tietojen ja tutkimuksen analysointiin.

Tilastotietojen ymmärtäminen

Tilastojen juurta ohjaavat muuttujat. Muuttuja on tietojoukko, joka voidaan laskea ja joka merkitsee kohteen ominaisuutta tai attribuuttia. Esimerkiksi autossa voi olla muuttujia, kuten merkki, malli, vuosi, mittarilukema, väri tai kunto. Yhdistämällä muuttujat tietojoukossa (eli kaikkien autojen värit tietyllä parkkipaikalla), tilastot auttavat meitä ymmärtämään paremmin trendejä ja tuloksia.

Muuttujia on kahta päätyyppiä. Ensinnäkin laadulliset muuttujat ovat erityisiä attribuutteja, jotka eivät usein ole numeerisia. Monet autoesimerkissä annetuista esimerkeistä ovat laadullisia. Muita esimerkkejä tilastojen laadullisista muuttujista ovat sukupuoli, silmien väri tai syntymäkaupunki. Laadullisia tietoja käytetään useimmiten määrittämään, kuinka suuri prosenttiosuus lopputuloksesta tapahtuu mille tahansa kvalitatiiviselle muuttujalle, ja kvalitatiivinen analyysi ei useinkaan perustu lukuihin. Jos esimerkiksi yrittää määrittää, kuinka suuri osuus naisista omistaa yrityksen, analysoi laadullisia tietoja.

Toinen tilastomuuttujien tyyppi ovat kvantitatiiviset muuttujat. Kvantitatiivisia muuttujia tutkitaan numeerisesti ja niillä on painoarvoa vain, kun kyseessä on ei-numeerinen kuvaaja. Samoin kuin kvantitatiivisessa analyysissä,. tämä tieto perustuu numeroihin. Yllä olevassa autoesimerkissä ajettu kilometrimäärä on määrällinen muuttuja. Numerolla 60 000 ei kuitenkaan ole arvoa, ellei ymmärrä, että se on ajettujen mailien kokonaismäärä.

Kvantitatiiviset muuttujat voidaan jakaa edelleen kahteen luokkaan. Ensinnäkin diskreetillä muuttujalla on rajoituksia tilastoissa, ja ne päättelevät, että mahdollisten diskreettien muuttujien arvojen välillä on aukkoja. Jalkapalloottelussa saatujen pisteiden määrä on diskreetti muuttuja, koska (1) ei voi olla desimaaleja ja (2) joukkue ei voi saada vain yhtä pistettä.

Toiseksi tilastoissa käytetään myös jatkuvia kvantitatiivisia muuttujia. Nämä arvot kulkevat asteikkoa pitkin - kun taas diskreeteillä arvoilla on rajoituksia, jatkuvat muuttujat mitataan usein desimaaleihin. Jalkapalloilijoiden pituutta mitattaessa voidaan saada mikä tahansa arvo (mahdollisissa rajoissa), ja korkeudet voidaan mitata 1/16 tuumaa, ellei pidemmälle.

Tilastotyöntekijöillä voi olla erilaisia nimikkeitä ja tehtäviä yrityksessä. Glassdoorin mukaan tilastotieteilijän keskimääräinen kokonaiskorvaus joulukuussa 2021 oli 98 034 dollaria. Tietotutkijan yhtä analyyttinen rooli tuotti lähes 119 000 dollarin vuosikorvauksen.

Tilastolliset mittaustasot

Kun muuttujat ja tulokset on analysoitu osana tilastoja, tuloksena on useita mittaustasoja. Tilastot voivat kvantifioida tulokset seuraavilla eri tavoilla:

  1. Nimellistason mittaus. Numeerista tai kvantitatiivista arvoa ei ole, eikä ominaisuuksia ole luokiteltu. Sen sijaan nimellistason mittaukset ovat yksinkertaisesti tunnisteita tai luokkia, jotka on määritetty muille muuttujille. On helpointa ajatella nimellistason mittauksia ei-numeerisina faktoina muuttujasta. Esimerkki: Vuonna 2020 valitun presidentin nimi oli Joseph Robinette Biden, Jr.

  2. Ordinaal Level Measurement: Tulokset voidaan järjestää järjestykseen, mutta kaikilla data-arvoilla on sama arvo tai paino. Vaikka numeerisia, järjestystason mittauksia tilastoissa ei voida vähentää keskenään, koska vain datapisteen sijainnilla on merkitystä. Usein ei- parametrisiin tilastoihin sisällytettyjä järjestyslukuja verrataan usein muuttujien kokonaisryhmään. Esimerkki: Amerikkalainen Fred Kerley oli 2. nopein mies vuoden 2020 Tokion olympialaisissa 100 metrin sprinttiaikojen perusteella.

  3. Välitason mittaus: Tulokset voidaan järjestää järjestyksessä; data-arvojen välisillä eroilla voi kuitenkin nyt olla merkitystä. Kahta eri datapistettä käytetään usein vertaamaan ajan kulumista tai muuttuvia olosuhteita tietojoukon sisällä. Tietojen arvoalueella ei usein ole "aloituspistettä", ja kalenteripäivämäärillä tai lämpötiloilla ei välttämättä ole merkityksellistä sisäistä nolla-arvoa. Esimerkki: Inflaatio oli 8,6 % toukokuussa 2022. Edellisen kerran inflaatio oli näin korkea joulukuussa 1981.

  4. Suhdetason mittaus: Tulokset voidaan järjestää järjestykseen, ja data-arvojen välisillä eroilla on nyt merkitys. Nyt on kuitenkin olemassa aloituspiste tai "nolla-arvo", jota voidaan käyttää edelleen antamaan arvoa tilastolliselle arvolle. Data-arvojen välisellä suhteella on nyt merkitys, mukaan lukien sen etäisyys nollasta. Esimerkki: Alin mitattu säälämpötila oli -128,6 Fahrenheit-astetta Etelämantereella.

Tilastot näytteenottotekniikat

Tilastotietojen keräämiseksi ei useinkaan olisi mahdollista kerätä tietoja kaikista populaation tietopisteistä. Sen sijaan tilastot nojaavat erilaisiin otantatekniikoihin luodakseen populaation edustavan osajoukon, joka on helpompi analysoida. Tilastoissa on useita ensisijaisia otantatyyppejä.

  • Yksinkertainen satunnaisotos edellyttää, että jokaisella populaation jäsenellä on yhtäläiset mahdollisuudet tulla valituksi analyysiin. Otannan perustana käytetään koko populaatiota ja mikä tahansa sattumanvarainen satunnaisgeneraattori voi valita otoskohteet. Esimerkiksi 100 henkilöä asetetaan riviin ja 10 valitaan sattumanvaraisesti.

  • Systemaattinen otanta edellyttää myös satunnaisotosta. Sen tekniikkaa on kuitenkin hieman muutettu johtamisen helpottamiseksi. Yksittäinen satunnaisluku luodaan ja yksilöitä valitaan sitten tietyin säännöllisin väliajoin, kunnes otoskoko on valmis. Esimerkiksi 100 yksilöä on rivissä ja numeroitu. Otokseen valitaan 7. yksilö ja sen jälkeen jokainen seuraava yhdeksäs yksilö, kunnes 10 näytekohdetta on valittu.

  • Ositettu näytteenotto edellyttää näytteen parempaa hallintaa. Populaatio on jaettu alaryhmiin samanlaisten ominaisuuksien perusteella. Sitten lasket kuinka monta henkilöä kustakin alaryhmästä edustaisi koko väestöä. Esimerkiksi 100 yksilöä on ryhmitelty sukupuolen ja rodun mukaan. Sitten kustakin alaryhmästä otetaan näyte siinä suhteessa, kuinka edustava alaryhmä on väestöstä.

  • Klusterinäytteenotto vaatii myös alaryhmiä. Jokaisen alaryhmän tulee kuitenkin edustaa väestöä. Sen sijaan, että alaryhmästä valittaisiin satunnaisesti yksilöitä, koko alaryhmä valitaan satunnaisesti.

Etkö ole varma, minkä Major League Baseball -pelaajan olisi pitänyt voittaa arvokkain pelaaja viime vuonna? Tilastot, joita käytetään usein arvon määrittämiseen, mainitaan usein, kun parhaan pelaajan palkinto myönnetään. Tilastot voivat sisältää lyöntikeskiarvon, osumien kotijuoksujen lukumäärän ja varastettujen tukien määrän.

Esimerkkejä tilastoista

Tilastot ovat näkyvästi rahoituksessa, sijoittamisessa, liiketoiminnassa ja maailmassa. Suuri osa näkemistäsi tiedoista ja sinulle annetuista tiedoista on peräisin tilastoista, joita käytetään kaikilla liiketoiminnan osa-alueilla.

  • Sijoittamisen tilastot sisältävät keskimääräisen kaupankäynnin volyymin, 52 viikon alimman, 52 viikon huippuarvon, beta-vaiheen ja korrelaation omaisuusluokkien tai arvopapereiden välillä.

  • Taloustieteen tilastot sisältävät BKT:n, työttömyyden, kuluttajahinnoittelun ja inflaation sekä muita talouskasvun mittareita.

  • markkinoinnin tilastot sisältävät tulosprosentit, napsautussuhteet, hakumäärät ja sosiaalisen median tiedot.

  • kirjanpidossa tilastot sisältävät likviditeetti-, vakavaraisuus- ja kannattavuusmittareita ajan mittaan.

  • tietotekniikassa tilastot sisältävät kaistanleveyden, verkkoominaisuudet ja laitteistologistiikan.

  • Henkilöstössä tilastot sisältävät henkilöstön vaihtuvuuden, henkilöstötyytyväisyyden ja keskimääräisen palkan suhteessa markkinoihin.

Kohokohdat

  • Tilastotietojen kokoamiseen voidaan käyttää useita otantatekniikoita, mukaan lukien yksinkertainen satunnainen, systemaattinen, ositettu tai klusteriotos.

  • Tilastot voidaan välittää eri tasoilla aina ei-numeerisesta kuvaajasta (nimellinen taso) numeeriseen nollapisteeseen (suhdetaso) viitaten.

  • Tilastot ovat läsnä lähes jokaisen yrityksen joka osastolla ja ovat myös kiinteä osa sijoittamista.

  • Tilastot ovat tietojen tutkimista ja käsittelyä, mukaan lukien tapoja kerätä, tarkastella, analysoida ja tehdä johtopäätöksiä tiedoista.

  • Tilastojen kaksi pääaluetta ovat kuvailevat ja päättelytilastot.

UKK

Mitä eroa on kuvailevilla ja päätelmätilastoilla?

Kuvaavia tilastoja käytetään kuvaamaan tai tekemään yhteenveto otoksen tai tietojoukon ominaisuuksista, kuten muuttujan keskiarvosta, keskihajonnasta tai taajuudesta. Päätelmätilastot sitä vastoin käyttävät mitä tahansa tekniikoita datajoukon muuttujien suhteuttamiseen toisiinsa, esimerkiksi käyttämällä korrelaatio- tai regressioanalyysiä. Näitä voidaan sitten käyttää arvioitaessa ennusteita tai päätelläkseen syy-yhteyttä.

Miksi tilastot ovat tärkeitä?

Tilastot tarjoavat tietoa asioiden toiminnasta. Tilastoja käytetään tutkimuksen tekemiseen, tulosten arviointiin, kriittisen ajattelun kehittämiseen ja tietoisten päätösten tekemiseen. Tilastojen avulla voidaan tiedustella melkein mitä tahansa tutkimusalaa, jotta voidaan selvittää, miksi asiat tapahtuvat, milloin ne tapahtuvat ja onko niiden toistuminen ennakoitavissa.

Kuka käyttää tilastoja?

Tilastoja käytetään laajasti erilaisissa sovelluksissa ja ammateissa. Aina kun tietoja kerätään ja analysoidaan, tilastoja tehdään. Tämä voi vaihdella valtion virastoista akateemiseen tutkimukseen investointien analysointiin.

Miten tilastoja käytetään taloustieteessä ja rahoituksessa?

Ekonomistit keräävät ja tarkastelevat kaikenlaista dataa kulutusmenoista asumisen alkamiseen ja inflaatioon BKT:n kasvuun. Rahoitusalalla analyytikot ja sijoittajat keräävät tietoa yrityksistä, toimialoista, mielipiteistä sekä markkinatietoja hinnoista ja volyymeista. Yhdessä päättelytilastojen käyttöä näillä aloilla kutsutaan ekonometriaksi. Useat tärkeät rahoitusmallit CAPM :stä Modern Portfolio Theory (MPT) ja Black-Scholes -optiohinnoittelumalliin perustuvat tilastollisiin päätelmiin.