Statistik
Vad Àr statistik?
Statistik Àr en gren av tillÀmpad matematik som involverar insamling, beskrivning, analys och slutledning av slutsatser frÄn kvantitativa data. De matematiska teorierna bakom statistik förlitar sig starkt pÄ differential- och integralkalkyl, linjÀr algebra och sannolikhetsteori.
Statistiker, personer som gör statistik, Àr sÀrskilt intresserade av att bestÀmma hur man drar tillförlitliga slutsatser om stora grupper och allmÀnna hÀndelser frÄn beteendet och andra observerbara egenskaper hos smÄ urval. Dessa smÄ prov representerar en del av den stora gruppen eller ett begrÀnsat antal fall av ett allmÀnt fenomen.
FörstÄ statistik
Statistik anvÀnds i praktiskt taget alla vetenskapliga discipliner sÄsom fysik och samhÀllsvetenskap, sÄvÀl som inom nÀringsliv, humaniora, myndigheter och tillverkning. Statistik Àr i grunden en gren av tillÀmpad matematik som utvecklats frÄn tillÀmpningen av matematiska verktyg inklusive kalkyl och linjÀr algebra till sannolikhetsteori.
I praktiken Àr statistik tanken att vi kan lÀra oss om egenskaperna hos stora uppsÀttningar objekt eller hÀndelser (en population ) genom att studera egenskaperna hos ett mindre antal liknande objekt eller hÀndelser (ett urval ). Eftersom det i mÄnga fall Àr för kostsamt, svÄrt eller helt omöjligt att samla in omfattande data om en hel population, börjar statistiken med ett urval som bekvÀmt eller överkomligt kan observeras.
TvÄ typer av statistiska metoder anvÀnds för att analysera data: beskrivande statistik och inferentiell statistik. Statistiker mÀter och samlar in data om individerna eller delarna av ett urval och analyserar sedan dessa data för att generera beskrivande statistik. De kan sedan anvÀnda dessa observerade egenskaper hos urvalsdata, som korrekt kallas "statistik", för att dra slutsatser eller utbildade gissningar om de omÀttade (eller omÀttade) egenskaperna hos den bredare populationen, kÀnda som parametrarna.
Statistik gÄr informellt tillbaka i Ärhundraden. Ett tidigt register över korrespondens mellan de franska matematikerna Pierre de Fermat och Blaise Pascal 1654 nÀmns ofta som ett tidigt exempel pÄ statistisk sannolikhetsanalys.
Beskrivande och slutledningsstatistik
De tvÄ huvudomrÄdena för statistik Àr kÀnda som beskrivande statistik, som beskriver egenskaperna hos urvals- och populationsdata, och slutsatsstatistik, som anvÀnder dessa egenskaper för att testa hypoteser och dra slutsatser. Beskrivande statistik inkluderar medelvÀrde (genomsnitt), varians, skevhet och kurtosis. Inferentiell statistik inkluderar linjÀr regressionsanalys,. variansanalys (ANOVA), logit/Probit-modeller och nollhypotestestning.
Beskrivande statistik
Beskrivande statistik fokuserar mest pÄ den centrala tendensen, variabiliteten och distributionen av provdata. Central tendens betyder uppskattning av egenskaperna, en typisk del av ett urval eller population, och inkluderar beskrivande statistik som medelvÀrde,. median och lÀge. Variabilitet hÀnvisar till en uppsÀttning statistik som visar hur stor skillnad det Àr mellan elementen i ett urval eller population lÀngs de uppmÀtta egenskaperna, och inkluderar mÄtt som intervall,. varians och standardavvikelse.
Fördelningen hÀnvisar till den övergripande "formen" av data, som kan avbildas pÄ ett diagram sÄsom ett histogram eller punktdiagram, och inkluderar egenskaper som sannolikhetsfördelningsfunktionen, skevhet och kurtos. Beskrivande statistik kan ocksÄ beskriva skillnader mellan observerade egenskaper hos elementen i en datamÀngd. Beskrivande statistik hjÀlper oss att förstÄ de samlade egenskaperna hos elementen i ett dataprov och utgör grunden för att testa hypoteser och göra förutsÀgelser med hjÀlp av inferentiell statistik.
Slutsatsstatistik
Inferentiell statistik Àr verktyg som statistiker anvÀnder för att dra slutsatser om egenskaperna hos en population, dragna frÄn egenskaperna hos ett urval, och för att avgöra hur sÀkra de kan vara pÄ tillförlitligheten av dessa slutsatser. Baserat pÄ urvalets storlek och fördelning kan statistiker berÀkna sannolikheten för att statistik, som mÀter den centrala tendensen, variabiliteten, fördelningen och sambanden mellan egenskaper inom ett dataurval, ger en korrekt bild av motsvarande parametrar för hela populationen frÄn vilken urvalet ritas.
Slutsatsstatistik anvÀnds för att göra generaliseringar om stora grupper, sÄsom att uppskatta den genomsnittliga efterfrÄgan pÄ en produkt genom att kartlÀgga ett urval av konsumenternas köpvanor eller för att försöka förutsÀga framtida hÀndelser, sÄsom att projicera den framtida avkastningen för ett vÀrdepapper eller tillgÄngsklass baserat pÄ returnerar under en provperiod.
Regressionsanalys Àr en allmÀnt anvÀnd teknik för statistisk slutledning som anvÀnds för att bestÀmma styrkan och naturen hos sambandet (dvs. korrelationen ) mellan en beroende variabel och en eller flera förklarande (oberoende) variabler. Resultatet av en regressionsmodell analyseras ofta med avseende pÄ statistisk signifikans,. vilket hÀnvisar till pÄstÄendet att ett resultat frÄn fynd som genererats genom testning eller experiment sannolikt inte har intrÀffat slumpmÀssigt eller av en slump utan sannolikt kan hÀnföras till en specifik orsak som belysts av uppgifterna. Att ha statistisk signifikans Àr viktigt för akademiska discipliner eller praktiker som Àr starkt beroende av att analysera data och forskning.
FörstÄ statistiska data
Roten till statistiken drivs av variabler. En variabel Àr en datamÀngd som kan rÀknas som markerar en egenskap eller ett attribut för en vara. Till exempel kan en bil ha variabler som mÀrke, modell, Är, körstrÀcka, fÀrg eller skick. Genom att kombinera variablerna över en uppsÀttning data (dvs. fÀrgerna pÄ alla bilar pÄ en given parkeringsplats) tillÄter statistik oss att bÀttre förstÄ trender och resultat.
Det finns tvÄ huvudtyper av variabler. För det första Àr kvalitativa variabler specifika attribut som ofta Àr icke-numeriska. MÄnga av exemplen som ges i bilexemplet Àr kvalitativa. Andra exempel pÄ kvalitativa variabler i statistik Àr kön, ögonfÀrg eller födelsestad. Kvalitativ data anvÀnds oftast för att bestÀmma hur stor andel av ett utfall som intrÀffar för en given kvalitativ variabel, och kvalitativ analys bygger ofta inte pÄ siffror. Att till exempel försöka avgöra hur stor andel av kvinnorna som Àger ett företag analyserar kvalitativa data.
Den andra typen av variabel i statistik Àr kvantitativa variabler. Kvantitativa variabler studeras numeriskt och har bara vikt nÀr de handlar om en icke-numerisk deskriptor. I likhet med kvantitativ analys Àr denna information rotad i siffror. I bilexemplet ovan Àr den körda körstrÀckan en kvantitativ variabel. Siffran 60 000 har dock inget vÀrde om man inte förstÄr att det Àr det totala antalet körda mil.
Kvantitativa variabler kan ytterligare delas in i tvÄ kategorier. För det första har diskreta variabler begrÀnsningar i statistiken och drar slutsatsen att det finns luckor mellan potentiella diskreta variabelvÀrden. Antalet poÀng som görs i en fotbollsmatch Àr en diskret variabel eftersom (1) det inte kan finnas nÄgra decimaler och (2) det Àr omöjligt för ett lag att bara fÄ 1 poÀng.
För det andra anvÀnder statistiken sig ocksÄ av kontinuerliga kvantitativa variabler. Dessa vÀrden löper lÀngs en skala - medan diskreta vÀrden har begrÀnsningar, mÀts kontinuerliga variabler ofta i decimaler. NÀr man mÀter fotbollsspelarnas höjd kan vilket vÀrde som helst (inom möjliga grÀnser) erhÄllas, och höjderna kan mÀtas ner till 1/16 tum om inte lÀngre.
Statistiker kan inneha olika titlar och befattningar inom ett företag. Enligt Glassdoor var den genomsnittliga totala ersÀttningen för en statistiker i december 2021 $98 034. En lika analytisk roll som dataforskare gav en Ärlig ersÀttning pÄ nÀstan 119 000 USD.
Statistiska mÀtnivÄer
Efter att ha analyserat variabler och utfall som en del av statistik, finns det flera resulterande mÀtnivÄer. Statistik kan kvantifiera utfall pÄ dessa olika sÀtt:
Nominell nivÄmÀtning. Det finns inget numeriskt eller kvantitativt vÀrde, och kvaliteter rangordnas inte. IstÀllet Àr nominella nivÄmÀtningar helt enkelt etiketter eller kategorier som tilldelas andra variabler. Det Àr lÀttast att tÀnka pÄ nominella nivÄmÀtningar som icke-numeriska fakta om en variabel. Exempel: Namnet pÄ presidenten som valdes 2020 var Joseph Robinette Biden, Jr.
Ordinal nivĂ„mĂ€tning: Resultaten kan ordnas i en ordning, dock har alla datavĂ€rden samma vĂ€rde eller vikt. Ăven om det Ă€r numeriskt, kan ordningsnivĂ„mĂ€tningar i statistik inte subtraheras mot varandra eftersom endast positionen för datapunkten har betydelse. OrdinalnivĂ„er , som ofta ingĂ„r i icke-parametrisk statistik,. jĂ€mförs ofta med den totala variabelgruppen. Exempel: Amerikanen Fred Kerley var den 2:a snabbaste mannen vid OS i Tokyo 2020 baserat pĂ„ 100-meters sprinttider.
MÀtning av intervallnivÄ: Resultaten kan ordnas i ordning; men skillnader mellan datavÀrden kan nu ha betydelse. TvÄ olika datapunkter anvÀnds ofta för att jÀmföra tidens gÄng eller förÀndrade förhÄllanden inom en datamÀngd. Det finns ofta ingen "startpunkt" för intervallet av datavÀrden, och kalenderdatum eller temperaturer kanske inte har ett meningsfullt inneboende nollvÀrde. Exempel: Inflationen nÄdde 8,6 % i maj 2022. Senast inflationen var sÄ hög var december 1981.
MÀtning av förhÄllandet: Resultaten kan ordnas i ordning, och skillnader mellan datavÀrden har nu betydelse. Men det finns nu en startpunkt eller "nollvÀrde" som kan anvÀndas för att ytterligare ge vÀrde till ett statistiskt vÀrde. FörhÄllandet mellan datavÀrden har nu betydelse, inklusive dess avstÄnd frÄn noll. Exempel: Den lÀgsta meteorologiska temperaturen som registrerats var -128,6 grader Fahrenheit i Antarktis.
Statistik Samplingstekniker
För att samla in statistisk information skulle det ofta inte vara möjligt att samla in data frÄn varje datapunkt inom en population. IstÀllet förlitar sig statistik pÄ olika urvalstekniker för att skapa en representativ delmÀngd av populationen som Àr lÀttare att analysera. Inom statistiken finns det flera primÀra typer av provtagning.
- Enkel stickprovstagning krÀver att alla medlemmar i populationen har lika stor chans att bli utvalda för analys. Hela populationen anvÀnds som utgÄngspunkt för urval, och valfri slumpgenerator baserad pÄ slumpen kan vÀlja urvalsobjekten. Till exempel stÀlls 100 individer upp och 10 vÀljs ut slumpmÀssigt.
â Systematisk urval krĂ€ver ocksĂ„ ett slumpmĂ€ssigt urval. Dess teknik Ă€r dock nĂ„got modifierad för att göra den lĂ€ttare att genomföra. Ett enda slumptal genereras, och individer vĂ€ljs sedan ut med ett angivet regelbundet intervall tills urvalsstorleken Ă€r komplett. Till exempel Ă€r 100 individer uppradade och numrerade. Den 7:e individen vĂ€ljs för provet följt av varje efterföljande 9:e individ tills 10 provobjekt har valts ut.
Stratifierad provtagning krÀver mer kontroll över ditt prov. Populationen delas in i undergrupper baserat pÄ liknande egenskaper. Sedan berÀknar du hur mÄnga personer frÄn varje undergrupp som skulle representera hela befolkningen. Till exempel Àr 100 individer grupperade efter kön och ras. Sedan kommer ett urval frÄn varje undergrupp att tas i andelen hur representativ den undergruppen Àr för befolkningen.
Klusterprovtagning krÀver ocksÄ undergrupper. Varje undergrupp bör dock vara representativ för befolkningen. IstÀllet för att slumpmÀssigt vÀlja individer inom en undergrupp, vÀljs hela undergruppen slumpmÀssigt.
Ăr du osĂ€ker pĂ„ vilken Major League Baseball-spelare som borde ha vunnit Most Valuable Player förra Ă„ret? Statistik, som ofta anvĂ€nds för att faststĂ€lla vĂ€rde, citeras ofta nĂ€r priset för bĂ€sta spelare delas ut. Statistik kan inkludera slaggenomsnitt, antal trĂ€ffade homeruns och stulna baser.
Exempel pÄ statistik
Statistik Àr framtrÀdande inom finans, investeringar, affÀrer och vÀrlden. Mycket av den information du ser och den information du fÄr hÀrrör frÄn statistik, som anvÀnds i alla aspekter av en verksamhet.
I investeringar inkluderar statistiken genomsnittlig handelsvolym, 52 veckors lÄg, 52 veckors hög, beta och korrelation mellan tillgÄngsklasser eller vÀrdepapper.
Inom ekonomi inkluderar statistiken BNP, arbetslöshet, konsumentprissÀttning och inflation och andra ekonomiska tillvÀxtmÄtt
Inom marknadsföring inkluderar statistiken konverteringsfrekvenser, klickfrekvenser, sökkvantiteter och mÀtvÀrden för sociala medier.
I redovisning inkluderar statistiken likviditet, solvens och lönsamhetsmÄtt över tid.
Inom informationsteknik inkluderar statistiken bandbredd, nÀtverkskapacitet och hÄrdvarulogistik.
Inom mÀnskliga resurser inkluderar statistiken personalomsÀttning, anstÀlldas nöjdhet och genomsnittlig ersÀttning i förhÄllande till marknaden.
Höjdpunkter
Ett antal urvalstekniker kan anvÀndas för att sammanstÀlla statistiska data inklusive enkel slumpmÀssig, systematisk, stratifierad eller klusterurval.
Statistik kan kommuniceras pÄ olika nivÄer, frÄn icke-numerisk deskriptor (nominell nivÄ) till numerisk med hÀnvisning till en nollpunkt (kvotnivÄ).
â Statistik finns pĂ„ nĂ€stan alla avdelningar i varje företag och Ă€r en integrerad del av investeringar ocksĂ„.
- Statistik Àr att studera och manipulera data, inklusive sÀtt att samla in, granska, analysera och dra slutsatser frÄn data.
â De tvĂ„ stora statistikomrĂ„dena Ă€r beskrivande och inferentiell statistik.
Vanliga frÄgor
Vad Àr skillnaden mellan beskrivande och inferentiell statistik?
Beskrivande statistik anvÀnds för att beskriva eller sammanfatta egenskaperna hos ett urval eller datamÀngd, sÄsom en variabels medelvÀrde, standardavvikelse eller frekvens. Inferentiell statistik dÀremot anvÀnder valfritt antal tekniker för att relatera variabler i en datauppsÀttning till varandra, till exempel med hjÀlp av korrelations- eller regressionsanalys. Dessa kan sedan anvÀndas för att uppskatta prognoser eller sluta sig till kausalitet.
Varför Àr statistik viktig?
Statistik ger information för att utbilda hur saker fungerar. Statistik anvÀnds för att bedriva forskning, utvÀrdera resultat, utveckla kritiskt tÀnkande och fatta vÀlgrundade beslut. Statistik kan anvÀndas för att undersöka nÀstan vilket omrÄde som helst för att undersöka varför saker hÀnder, nÀr de intrÀffar och om det Àr förutsÀgbart att det Äterkommer.
Vem anvÀnder statistik?
Statistik anvÀnds i stor utstrÀckning inom en rad tillÀmpningar och yrken. Varje gÄng data samlas in och analyseras görs statistik. Det kan vara allt frÄn statliga myndigheter till akademisk forskning till att analysera investeringar.
Hur anvÀnds statistik inom ekonomi och finans?
Ekonomer samlar in och tittar pÄ alla typer av data, allt frÄn konsumentutgifter till bostadsstarter till inflation till BNP-tillvÀxt. Inom finans samlar analytiker och investerare in data om företag, branscher, sentiment och marknadsdata om pris och volym. Tillsammans Àr anvÀndningen av inferentiell statistik inom dessa omrÄden kÀnd som ekonometri. Flera viktiga finansiella modeller frÄn CAPM till Modern Portfolio Theory (MPT) och Black-Scholes optionsprissÀttningsmodell förlitar sig pÄ statistisk slutledning.