Ikke-parametrisk metode

Hvad er den ikke-parametriske metode?

Den ikke-parametriske metode refererer til en type statistik, der ikke gør nogen antagelser om prøvens karakteristika (dens parametre), eller om de observerede data er kvantitative eller kvalitative.

Ikke-parametrisk statistik kan omfatte visse beskrivende statistikker,. statistiske modeller, inferens og statistiske test. Modelstrukturen for ikke-parametriske metoder er ikke specificeret a priori, men er i stedet bestemt ud fra data.

Udtrykket "ikke-parametrisk" er ikke ment at antyde, at sådanne modeller fuldstændig mangler parametre, men derimod at antallet og arten af parametrene er fleksible og ikke faste på forhånd. Et histogram er et eksempel på et ikke-parametrisk estimat af en sandsynlighedsfordeling.

I modsætning hertil gør velkendte statistiske metoder såsom ANOVA,. Pearsons korrelation,. t-test og andre antagelser om de data, der analyseres. En af de mest almindelige parametriske antagelser er, at befolkningsdata har en " normalfordeling."

Hvordan den ikke-parametriske metode virker

Parametriske og ikke-parametriske metoder bruges ofte på forskellige typer data. Parametrisk statistik kræver generelt interval- eller forholdsdata. Et eksempel på denne type data er alder, indkomst, højde og vægt, hvor værdierne er kontinuerlige, og intervallerne mellem værdier har betydning.

I modsætning hertil bruges ikke-parametrisk statistik typisk på data, der er nominelle eller ordinale. Nominelle variable er variable, for hvilke værdierne ikke har kvantitativ værdi. Fælles nominelle variabler i samfundsvidenskabelig forskning inkluderer for eksempel køn, hvis mulige værdier er diskrete kategorier, "mand" og "kvinde." Andre almindelige nominelle variabler i samfundsvidenskabelig forskning er race, civilstand, uddannelsesniveau og beskæftigelsesstatus (beskæftiget kontra ledige).

Ordinalvariable er dem, hvor værdien antyder en rækkefølge. Et eksempel på en ordinalvariabel ville være, hvis en respondent spurgte: "På en skala fra 1 til 5, hvor 1 er ekstremt utilfreds og 5 er ekstremt tilfreds, hvordan vil du bedømme din oplevelse med kabelselskabet?"

Parametrisk statistik kan dog også anvendes på populationer med andre kendte distributionstyper. Ikke-parametrisk statistik kræver ikke, at befolkningsdataene opfylder de forudsætninger, der kræves for parametrisk statistik. Ikke-parametrisk statistik falder derfor ind under en kategori af statistikker, der nogle gange omtales som distributionsfri. Ofte vil ikke-parametriske metoder blive brugt, når populationsdataene har en ukendt fordeling, eller når stikprøvestørrelsen er lille.

Særlige overvejelser

Selvom ikke-parametrisk statistik har den fordel at skulle opfylde få antagelser, er de mindre kraftfulde end parametriske statistikker. Det betyder, at de muligvis ikke viser en sammenhæng mellem to variable, når der faktisk eksisterer en.

Ikke-parametriske statistikker har fået anerkendelse på grund af deres brugervenlighed. Efterhånden som behovet for parametre aflastes, bliver dataene mere anvendelige til et større udvalg af tests. Denne type statistik kan bruges uden middelværdi, stikprøvestørrelse, standardafvigelse eller estimering af andre relaterede parametre, når ingen af disse oplysninger er tilgængelige.

Da ikke-parametrisk statistik gør færre antagelser om prøvedataene, er dens anvendelse bredere end parametrisk statistik. I tilfælde, hvor parametrisk test er mere passende, vil ikke-parametriske metoder være mindre effektive. Dette skyldes, at ikke-parametriske statistikker kasserer nogle oplysninger, der er tilgængelige i dataene, i modsætning til parametriske statistikker.

Almindelige ikke-parametriske test inkluderer Chi-Square,. Wilcoxon rank-sum test,. Kruskal-Wallis test og Spearmans rank-order korrelation.

Eksempler på den ikke-parametriske metode

Overvej en finansanalytiker, der ønsker at estimere værdi-at-risiko (VaR) af en investering. Analytikeren indsamler indtjeningsdata fra hundredvis af lignende investeringer over en lignende tidshorisont. I stedet for at antage, at indtjeningen følger en normalfordeling, bruger hun histogrammet til at estimere fordelingen ikke-parametrisk. Den 5. percentil af dette histogram giver derefter analytikeren et ikke-parametrisk estimat af VaR.

For et andet eksempel, overvej en anden forsker, der ønsker at vide, om gennemsnitlige timers søvn er forbundet med, hvor ofte man bliver syg. Fordi mange mennesker sjældent eller overhovedet bliver syge, og andre lejlighedsvis bliver syge langt oftere end de fleste andre, er fordelingen af sygdomshyppigheden klart ikke-normal, idet den er højreskæv og tilbøjelig til afvigelser.

I stedet for at bruge en metode, der forudsætter en normalfordeling for sygdomshyppighed, som det f.eks. gøres i klassisk regressionsanalyse, beslutter forskeren sig for at bruge en ikke-parametrisk metode, såsom kvantil regressionsanalyse.

Højdepunkter

Dette er i modsætning til parametriske metoder, som gør antagelser om formen eller karakteristika af dataene. Eksempler på sådanne metoder omfatter normalfordelingsmodellen og den lineære regressionsmodel.
Den ikke-parametriske metode er en gren af statistik, hvor data ikke antages at komme fra foreskrevne modeller, der er bestemt af et lille antal parametre.
Den ikke-parametriske analyse er ofte bedst egnet, når man overvejer rækkefølgen af noget, hvor selv hvis de numeriske data ændres, vil resultaterne sandsynligvis forblive de samme.