Investor's wiki

Tölfræði

Tölfræði

Hvað er tölfræði?

Tölfræði er grein hagnýtrar stærðfræði sem felur í sér söfnun, lýsingu, greiningu og ályktanir ályktana út frá megindlegum gögnum. Stærðfræðikenningarnar á bak við tölfræði byggja að miklu leyti á mismuna- og heilareikningi, línulegri algebru og líkindafræði.

Tölfræðimenn, fólk sem stundar tölfræði, er sérstaklega upptekið af því að ákvarða hvernig á að draga áreiðanlegar ályktanir um stóra hópa og almenna atburði út frá hegðun og öðrum sjáanlegum einkennum lítilla úrtaks. Þessi litlu sýni tákna hluta af stóra hópnum eða takmarkaðan fjölda tilvika um almennt fyrirbæri.

Skilningur á tölfræði

Tölfræði er notuð í nánast öllum vísindagreinum eins og raunvísindum og félagsvísindum, sem og í viðskiptum, hugvísindum, stjórnvöldum og framleiðslu. Tölfræði er í grundvallaratriðum grein hagnýtrar stærðfræði sem þróaðist frá beitingu stærðfræðilegra tækja, þar á meðal reikninga og línulegrar algebru, yfir í líkindafræði.

Í reynd er tölfræði sú hugmynd sem við getum lært um eiginleika stórra hluta af hlutum eða atburðum ( þýði ) með því að rannsaka eiginleika minni fjölda svipaðra hluta eða atburða ( sýnishorn ). Vegna þess að í mörgum tilfellum er of kostnaðarsamt, erfitt eða ómögulegt að safna yfirgripsmiklum gögnum um heilt þýði, byrjar tölfræði á úrtaki sem hægt er að fylgjast með á þægilegan hátt eða á viðráðanlegu verði.

Tvenns konar tölfræðilegar aðferðir eru notaðar við greiningu gagna: lýsandi tölfræði og ályktunartölfræði. Tölfræðimenn mæla og safna gögnum um einstaklinga eða þætti úrtaks, greina síðan þessi gögn til að búa til lýsandi tölfræði. Þeir geta síðan notað þessa athugaðu eiginleika úrtaksgagnanna, sem eru rétt kölluð „tölfræði“, til að draga ályktanir eða fræðilegar getgátur um ómælda (eða ómælda) eiginleika breiðari íbúanna, þekktir sem breytur.

Tölfræði nær óformlega aftur í aldir. Snemma skrá yfir bréfaskipti frönsku stærðfræðinganna Pierre de Fermat og Blaise Pascal árið 1654 er oft nefnd sem snemma dæmi um tölfræðilega líkindagreiningu.

Lýsandi og ályktunartölfræði

Tvö helstu svið tölfræði eru þekkt sem lýsandi tölfræði, sem lýsir eiginleikum úrtaks- og íbúagagna, og ályktunartölfræði, sem notar þessa eiginleika til að prófa tilgátur og draga ályktanir. Lýsandi tölfræði felur í sér meðaltal (meðaltal), dreifni, skekkju og kurtosis. Ályktunartölfræði felur í sér línulega aðhvarfsgreiningu,. dreifigreiningu (ANOVA), logit/Probit líkön og núlltilgátuprófun.

Lýsandi tölfræði

Lýsandi tölfræði einblínir að mestu á miðlæga tilhneigingu, breytileika og dreifingu úrtaksgagna. Miðlæg tilhneiging þýðir mat á eiginleikum, dæmigerður þáttur úrtaks eða þýðis, og inniheldur lýsandi tölfræði eins og meðaltal,. miðgildi og háttur. Breytileiki vísar til tölfræðisetts sem sýnir hversu mikill munur er á þáttum úrtaks eða þýðis meðfram mældum eiginleikum, og inniheldur mælikvarða eins og svið,. dreifni og staðalfrávik.

Dreifingin vísar til heildar "lögunar" gagnanna, sem hægt er að sýna á myndriti eins og súluriti eða punktaplotti, og inniheldur eiginleika eins og líkindadreifingarfall, skekkju og kurtosis . Lýsandi tölfræði getur einnig lýst mismun á einkennum þátta gagnasafns. Lýsandi tölfræði hjálpar okkur að skilja sameiginlega eiginleika þátta gagnasýnis og mynda grundvöll fyrir að prófa tilgátur og gera spár með því að nota ályktunartölfræði.

Ályktunartölfræði

Ályktunartölfræði er verkfæri sem tölfræðingar nota til að draga ályktanir um eiginleika þýðis, dregnar út frá einkennum úrtaks, og til að ákveða hversu vissir þeir geta verið um áreiðanleika þessara ályktana. Á grundvelli úrtaksstærðar og dreifingar geta tölfræðingar reiknað út líkurnar á því að tölfræði, sem mæla miðlæga tilhneigingu, breytileika, dreifingu og tengsl á milli eiginleika innan gagnaúrtaks, gefi nákvæma mynd af samsvarandi breytum alls þýðisins sem úrtakið er úr. er dregið.

Ályktunartölfræði er notuð til að alhæfa um stóra hópa, svo sem að áætla meðaleftirspurn eftir vöru með því að skoða úrtak af kaupvenjum neytenda eða til að reyna að spá fyrir um framtíðaratburði, eins og að spá fyrir um framtíðarávöxtun verðbréfa eða eignaflokks út frá skilar á úrtakstímabili.

Aðhvarfsgreining er mikið notuð tækni til tölfræðilegrar ályktunar sem notuð er til að ákvarða styrk og eðli tengsla (þ.e. fylgni ) milli háðrar breytu og einnar eða fleiri skýrandi (óháðra) breyta. Framleiðsla aðhvarfslíkans er oft greind með tilliti til tölfræðilegrar marktektar,. sem vísar til fullyrðingar um að ekki sé líklegt að niðurstaða úr niðurstöðum sem framleiddar eru með prófun eða tilraunum hafi átt sér stað af handahófi eða tilviljun en líklegt er að hún megi rekja til ákveðinnar orsaka sem skýrðar eru af gögnin. Að hafa tölfræðilega marktekt er mikilvægt fyrir akademískar greinar eða iðkendur sem reiða sig mikið á að greina gögn og rannsóknir.

Skilningur á tölfræðilegum gögnum

Rót tölfræðinnar er knúin áfram af breytum. Breyta er gagnamengi sem hægt er að telja sem markar einkenni eða eiginleika hlutar. Til dæmis getur bíll haft breytur eins og tegund, gerð, árgerð, kílómetrafjölda, lit eða ástand. Með því að sameina breyturnar yfir gagnasett (þ.e. liti allra bíla á tilteknu bílastæði) gerir tölfræði okkur kleift að skilja betur þróun og niðurstöður.

Það eru tvær megingerðir af breytum. Í fyrsta lagi eru eigindlegar breytur sérstakir eiginleikar sem eru oft ekki tölulegar. Mörg dæmanna sem gefin eru í bíladæminu eru eigindleg. Önnur dæmi um eigindlegar breytur í tölfræði eru kyn, augnlitur eða fæðingarborg. Eigindleg gögn eru oftast notuð til að ákvarða hversu hátt hlutfall af niðurstöðu kemur fyrir hverja tiltekna eigindlega breytu og eigindleg greining byggir oft ekki á tölum. Til dæmis, þegar reynt er að ákvarða hversu hátt hlutfall kvenna eiga fyrirtæki, eru eigindleg gögn greind.

Önnur tegund breytu í tölfræði er megindlegar breytur. Magnbreytur eru rannsakaðar tölulega og hafa aðeins vægi þegar um er að ræða ótalnalegan lýsingu. Líkur á magngreiningu eiga þessar upplýsingar rætur í tölum. Í bíladæminu hér að ofan er ekinn kílómetrafjöldi magnbreyta. Hins vegar hefur talan 60.000 ekkert gildi nema skilið sé að það sé heildarfjöldi ekinna kílómetra.

Hægt er að skipta megindlegum breytum frekar í tvo flokka. Í fyrsta lagi hafa stakar breytur takmarkanir í tölfræði og álykta að það sé bil á milli hugsanlegra stakra breytugilda. Fjöldi stiga sem skoruð eru í fótboltaleik er aðgreind breyta því (1) það geta ekki verið aukastafir og (2) það er ómögulegt fyrir lið að skora aðeins 1 stig.

Í öðru lagi notar tölfræði einnig samfelldar megindlegar breytur. Þessi gildi liggja eftir kvarða - á meðan aðgreind gildi hafa takmarkanir eru samfelldar breytur oft mældar í aukastafi. Þegar hæð fótboltamanna er mæld er hægt að fá hvaða gildi sem er (innan mögulegra marka) og hægt er að mæla hæðirnar niður í 1/16 tommu ef ekki lengra.

Tölfræðimenn geta haft mismunandi titla og störf innan fyrirtækis. Samkvæmt Glassdoor voru meðaltal heildarbætur fyrir tölfræðing í desember 2021 $ 98.034. Jafnt greinandi hlutverk gagnafræðings skilaði árlegum bótum upp á næstum $119.000.

Tölfræðileg mælistig

Eftir að hafa greint breytur og útkomu sem hluta af tölfræði, eru nokkur mælistig sem myndast. Tölfræði getur mælt niðurstöður á þessa mismunandi vegu:

  1. Nafnstigsmæling. Það er ekkert tölulegt eða megindlegt gildi og eiginleikum er ekki raðað. Þess í stað eru nafnstigsmælingar einfaldlega merki eða flokkar sem úthlutað er öðrum breytum. Auðveldast er að hugsa um nafnstigsmælingar sem ótölulegar staðreyndir um breytu. Dæmi: Nafn forsetans sem kjörinn var árið 2020 var Joseph Robinette Biden, Jr.

  2. Ordinal Level Measurement: Hægt er að raða niðurstöðum í röð, þó hafa öll gagnagildi sama gildi eða vægi. Þó tölulegar mælingar í tölfræði er ekki hægt að draga frá hvor annarri þar sem aðeins staðsetning gagnapunktsins skiptir máli. Oft felld inn í tölfræði sem ekki er parametrisk,. eru riðlastig oft borin saman við heildarbreytuhópinn. Dæmi: Bandaríkjamaðurinn Fred Kerley var 2. fljótasti maðurinn á Ólympíuleikunum í Tókýó 2020 miðað við 100 metra spretttíma.

  3. Mæling millibilsstigs: Hægt er að raða niðurstöðum í röð; þó munur á gagnagildum gæti nú haft þýðingu. Tveir mismunandi gagnapunktar eru oft notaðir til að bera saman tíma sem líður eða breyttar aðstæður innan gagnasafns. Það er oft enginn „upphafspunktur“ fyrir svið gagnagilda og dagatalsdagsetningar eða hitastig hafa kannski ekki marktækt innra núllgildi. Dæmi: Verðbólga fór í 8,6% í maí 2022. Síðast þegar verðbólga var svona mikil var desember 1981.

  4. Mæling á hlutfallsstigi: Hægt er að raða niðurstöðum í röð og munur á gagnagildum hefur nú merkingu. Hins vegar er nú upphafspunktur eða „núllgildi“ sem hægt er að nota til að veita tölfræðilegu gildi frekar gildi. Hlutfallið milli gagnagilda hefur nú merkingu, þar á meðal fjarlægð frá núlli. Dæmi: Lægsti veðurhiti sem mælst hefur var -128,6 gráður á Fahrenheit á Suðurskautslandinu.

Tölfræði sýnatökutækni

Til að safna tölfræðilegum upplýsingum væri oft ekki hægt að safna gögnum frá hverjum gagnapunkti innan þýðis. Þess í stað treystir tölfræði á mismunandi sýnatökuaðferðir til að búa til dæmigerðan hlutmengi þýðisins sem er auðveldara að greina. Í tölfræði eru nokkrar helstu tegundir sýnatöku.

  • Einfalt slembiúrtak kallar á að allir meðlimir innan þýðisins hafi jafna möguleika á að vera valinn til greiningar. Allt þýðið er notað sem grunnur fyrir sýnatöku og hvaða slembivaldur sem er byggður á tilviljun getur valið úrtaksatriðin. Til dæmis eru 100 einstaklingar í röð og 10 valdir af handahófi.

  • Kerfisbundið úrtak kallar líka á slembiúrtak. Hins vegar er tækni þess lítillega breytt til að auðvelda framkvæmd. Ein handahófskennd tala er mynduð og einstaklingar eru síðan valdir með tilteknu reglulegu millibili þar til úrtaksstærð er lokið. Til dæmis eru 100 einstaklingar stilltir upp og númeraðir. Sjöundi einstaklingurinn er valinn í úrtakið og síðan hver 9. einstaklingur þar til 10 úrtaksatriði hafa verið valin.

  • Lagskipt sýnataka kallar á meiri stjórn á úrtakinu þínu. Þýðinu er skipt í undirhópa út frá svipuðum eiginleikum. Síðan reiknarðu út hversu margir úr hverjum undirhópi myndu tákna allan íbúafjöldann. Til dæmis eru 100 einstaklingar flokkaðir eftir kyni og kynþætti. Síðan verður tekið úrtak úr hverjum undirhópi í hlutfalli af því hversu dæmigerður sá undirhópur er fyrir þýðið.

  • Sýnataka úr klasa kallar líka á undirhópa. Hins vegar ætti hver undirhópur að vera fulltrúi íbúanna. Í stað þess að velja einstaklinga af handahófi innan undirhóps er allur undirhópurinn valinn af handahófi.

Ertu ekki viss um hvaða hafnaboltaleikmaður í Meistaradeildinni hefði átt að vinna verðmætasta leikmanninn á síðasta ári? Tölfræði, oft notuð til að ákvarða gildi, er oft vitnað í þegar verðlaunin fyrir besta leikmanninn eru veitt. Tölfræði getur falið í sér meðaltal slatta, fjölda högga á heimavelli og stolna stöð.

Dæmi um tölfræði

Tölfræði er áberandi í fjármálum, fjárfestingum, viðskiptum og heiminum. Mikið af þeim upplýsingum sem þú sérð og gögnunum sem þú færð er unnin úr tölfræði, sem er notuð í öllum hliðum fyrirtækja.

  • Í fjárfestingu eru tölfræði meðalviðskiptamagn, 52 vikna lágmark, 52 vikna há, beta og fylgni milli eignaflokka eða verðbréfa.

  • Í hagfræði innihalda tölfræði landsframleiðslu, atvinnuleysi, neysluverðlagningu og verðbólgu og aðrar hagvaxtartölur

  • Í markaðssetningu inniheldur tölfræði viðskiptahlutfall, smellihlutfall, leitarmagn og mæligildi á samfélagsmiðlum.

  • Í bókhaldi innihalda tölfræði tölur um lausafjárstöðu, gjaldþol og arðsemi yfir tíma.

  • Í upplýsingatækni inniheldur tölfræði bandbreidd, netgetu og vélbúnaðarflutninga.

  • Í mannauði felur tölfræði í sér starfsmannaveltu, ánægju starfsmanna og meðallaun miðað við markaðinn.

Hápunktar

  • Hægt er að nota fjölda úrtaksaðferða til að taka saman tölfræðileg gögn, þar á meðal einföld slembiúrtak, kerfisbundið, lagskipt eða klasaúrtak.

  • Hægt er að miðla tölfræði á mismunandi stigum, allt frá ótölulegum lýsingu (nafnstigi) til tölulegra með vísan til núllpunkts (hlutfallsstig).

  • Tölfræði er til staðar í næstum öllum deildum hvers fyrirtækis og er einnig óaðskiljanlegur hluti af fjárfestingum.

  • Tölfræði er rannsókn og meðferð gagna, þar á meðal leiðir til að safna, endurskoða, greina og draga ályktanir af gögnum.

  • Tvö helstu svið tölfræði eru lýsandi og ályktunartölfræði.

Algengar spurningar

Hver er munurinn á lýsandi og ályktunartölfræði?

Lýsandi tölfræði er notuð til að lýsa eða draga saman eiginleika úrtaks eða gagnasafns, svo sem meðaltal breyta, staðalfráviki eða tíðni. Ályktunartölfræði, hins vegar, notar hvaða fjölda aðferða sem er til að tengja breytur í gagnasafni hver við aðra, til dæmis með því að nota fylgni eða aðhvarfsgreiningu. Þetta er síðan hægt að nota til að áætla spár eða álykta um orsakasamhengi.

Hvers vegna er tölfræði mikilvæg?

Tölfræði gefur upplýsingar til að fræða hvernig hlutirnir virka. Tölfræði er notuð til að framkvæma rannsóknir, meta niðurstöður, þróa gagnrýna hugsun og taka upplýstar ákvarðanir. Tölfræði er hægt að nota til að spyrjast fyrir um nánast hvaða fræðasvið sem er til að kanna hvers vegna hlutir gerast, hvenær þeir gerast og hvort endurkomu þeirra sé fyrirsjáanleg.

Hver notar tölfræði?

Tölfræði er notuð víða í fjölda umsókna og starfsgreina. Í hvert sinn sem gögnum er safnað og greind er verið að gera tölfræði. Þetta getur verið allt frá ríkisstofnunum til fræðilegra rannsókna til að greina fjárfestingar.

Hvernig er tölfræði notuð í hagfræði og fjármálum?

Hagfræðingar safna og skoða alls kyns gögn, allt frá neysluútgjöldum til húsnæðisbyrjunar til verðbólgu til hagvaxtar. Í fjármálum safna sérfræðingar og fjárfestar gögnum um fyrirtæki, atvinnugreinar, viðhorf og markaðsgögn um verð og magn. Saman er notkun ályktunartölfræði á þessum sviðum þekkt sem hagfræði. Nokkur mikilvæg fjármálalíkön frá CAPM til Modern Portfolio Theory (MPT) og Black-Scholes valkostaverðlagningarlíkansins, treysta á tölfræðilega ályktun.