Icke-parametrisk statistik
Vad Àr icke-parametrisk statistik?
Icke-parametrisk statistik avser en statistisk metod dÀr data inte antas komma frÄn föreskrivna modeller som bestÀms av ett litet antal parametrar; exempel pÄ sÄdana modeller inkluderar normalfördelningsmodellen och den linjÀra regressionsmodellen. Icke-parametrisk statistik anvÀnder ibland data som Àr ordningsföljd, vilket innebÀr att den inte förlitar sig pÄ siffror, utan snarare pÄ en rangordning eller ordningsföljd. Till exempel skulle en undersökning som förmedlar konsumentpreferenser som strÀcker sig frÄn gillar till ogillar betraktas som ordinarie data.
Icke-parametrisk statistik inkluderar icke-parametrisk beskrivande statistik,. statistiska modeller, slutledningar och statistiska test. Modellstrukturen för icke-parametriska modeller Àr inte specificerad a priori utan bestÀms istÀllet utifrÄn data. Termen icke-parametrisk Àr inte menad att antyda att sÄdana modeller helt saknar parametrar, utan snarare att antalet och arten av parametrarna Àr flexibla och inte fixerade i förvÀg. Ett histogram Àr ett exempel pÄ en icke-parametrisk uppskattning av en sannolikhetsfördelning.
FörstÄ icke-parametrisk statistik
I statistik inkluderar parametrisk statistik parametrar som medelvĂ€rde, standardavvikelse, Pearson-korrelation, varians etc. Denna form av statistik anvĂ€nder de observerade data för att uppskatta fördelningens parametrar. Under parametrisk statistik antas data ofta komma frĂ„n en normalfördelning med okĂ€nda parametrar ÎŒ (populationsmedelvĂ€rde) och Ï2 (populationsvarians), som sedan uppskattas med hjĂ€lp av urvalsmedelvĂ€rde och urvalsvarians.
Icke-parametrisk statistik gör inga antaganden om urvalsstorleken eller om de observerade uppgifterna Àr kvantitativa.
Icke-parametrisk statistik förutsĂ€tter inte att data hĂ€mtas frĂ„n en normalfördelning. IstĂ€llet uppskattas fördelningens form under denna form av statistisk mĂ€tning. Ăven om det finns mĂ„nga situationer dĂ€r en normalfördelning kan antas, finns det ocksĂ„ vissa scenarier dĂ€r den verkliga datagenereringsprocessen Ă€r lĂ„ngt ifrĂ„n normalfördelad.
Exempel pÄ icke-parametrisk statistik
I det första exemplet, övervÀg en finansanalytiker som vill uppskatta vÀrde-at-risk (VaR) för en investering. Analytikern samlar in resultatdata frÄn 100-tals liknande investeringar över en liknande tidshorisont. IstÀllet för att anta att intÀkterna följer en normalfördelning anvÀnder de histogrammet för att uppskatta fördelningen icke-parametriskt. Den 5:e percentilen i detta histogram ger sedan analytikern en icke-parametrisk uppskattning av VaR.
Som ett andra exempel, övervÀg en annan forskare som vill veta om genomsnittliga timmars sömn Àr kopplat till hur ofta man blir sjuk. Eftersom mÄnga mÀnniskor blir sjuka sÀllan, om alls, och enstaka andra blir sjuka mycket oftare Àn de flesta andra, Àr fördelningen av sjukdomsfrekvensen helt klart onormal, den Àr höger-sned och avvikerbenÀgen. I stÀllet för att anvÀnda en metod som utgÄr frÄn en normalfördelning för sjukdomsfrekvens, som till exempel görs i klassisk regressionsanalys, bestÀmmer sig forskaren för att anvÀnda en icke-parametrisk metod som till exempel kvantil regressionsanalys.
SÀrskilda övervÀganden
Icke-parametrisk statistik har vunnit uppskattning pÄ grund av sin anvÀndarvÀnlighet. I takt med att behovet av parametrar minskar blir data mer applicerbara för en större mÀngd olika tester. Denna typ av statistik kan anvÀndas utan medelvÀrde, urvalsstorlek, standardavvikelse eller uppskattning av andra relaterade parametrar nÀr ingen av den informationen Àr tillgÀnglig.
Eftersom icke-parametrisk statistik gör fÀrre antaganden om provdata, Àr dess tillÀmpning bredare Àn parametrisk statistik. I de fall dÀr parametrisk testning Àr lÀmpligare kommer icke-parametriska metoder att vara mindre effektiva. Detta beror pÄ att icke-parametrisk statistik förkastar viss information som Àr tillgÀnglig i datan, till skillnad frÄn parametrisk statistik.
Höjdpunkter
â Den hĂ€r typen av analys Ă€r ofta bĂ€st lĂ€mpad nĂ€r man övervĂ€ger ordningen pĂ„ nĂ„got, dĂ€r Ă€ven om de numeriska data Ă€ndras, kommer resultaten sannolikt att förbli desamma.
- Icke-parametrisk statistik Àr lÀtt att anvÀnda men erbjuder inte den exakta precisionen hos andra statistiska modeller.