Ikke-parametrisk metode

Hva er den ikke-parametriske metoden?

Den ikke-parametriske metoden refererer til en type statistikk som ikke gjør noen antakelser om egenskapene til utvalget (dets parametere) eller om de observerte dataene er kvantitative eller kvalitative.

Ikke-parametrisk statistikk kan inkludere visse beskrivende statistikker,. statistiske modeller, slutninger og statistiske tester. Modellstrukturen til ikke-parametriske metoder er ikke spesifisert a priori, men bestemmes i stedet fra data.

Begrepet "ikke-parametrisk" er ikke ment å antyde at slike modeller fullstendig mangler parametere, men snarere at antallet og arten av parameterne er fleksible og ikke faste på forhånd. Et histogram er et eksempel på et ikke-parametrisk estimat av en sannsynlighetsfordeling.

I motsetning til dette gjør velkjente statistiske metoder som ANOVA,. Pearsons korrelasjon,. t-test og andre antakelser om dataene som analyseres. En av de vanligste parametriske antakelsene er at populasjonsdata har en " normalfordeling."

Hvordan den ikke-parametriske metoden fungerer

Parametriske og ikke-parametriske metoder brukes ofte på ulike typer data. Parametrisk statistikk krever vanligvis intervall- eller forholdsdata. Et eksempel på denne typen data er alder, inntekt, høyde og vekt der verdiene er kontinuerlige og intervallene mellom verdier har betydning.

Derimot brukes ikke-parametrisk statistikk vanligvis på data som er nominelle eller ordinære. Nominelle variabler er variabler der verdiene ikke har kvantitative verdier. Vanlige nominelle variabler i samfunnsvitenskapelig forskning inkluderer for eksempel kjønn, hvis mulige verdier er diskrete kategorier, "mannlig" og "kvinnelig." Andre vanlige nominelle variabler i samfunnsvitenskapelig forskning er rase, sivilstatus, utdanningsnivå og sysselsettingsstatus (sysselsatt versus arbeidsledig).

Ordinalvariabler er de der verdien antyder en eller annen rekkefølge. Et eksempel på en ordinalvariabel ville være hvis en respondent spurte: "På en skala fra 1 til 5, hvor 1 er ekstremt misfornøyd og 5 er ekstremt fornøyd, hvordan vil du vurdere din erfaring med kabelselskapet?"

Parametrisk statistikk kan imidlertid også brukes på populasjoner med andre kjente distribusjonstyper. Ikke-parametrisk statistikk krever ikke at populasjonsdataene oppfyller forutsetningene som kreves for parametrisk statistikk. Ikke-parametrisk statistikk faller derfor inn i en kategori av statistikk noen ganger referert til som distribusjonsfri. Ofte vil ikke-parametriske metoder bli brukt når populasjonsdataene har en ukjent fordeling, eller når utvalgsstørrelsen er liten.

Spesielle hensyn

Selv om ikke-parametrisk statistikk har fordelen av å måtte oppfylle få forutsetninger, er den mindre kraftig enn parametrisk statistikk. Dette betyr at de kanskje ikke viser en sammenheng mellom to variabler når en faktisk eksisterer.

Ikke-parametrisk statistikk har fått verdsettelse på grunn av deres brukervennlighet. Ettersom behovet for parametere avlastes, blir dataene mer anvendelige for et større utvalg av tester. Denne typen statistikk kan brukes uten gjennomsnitt, utvalgsstørrelse, standardavvik eller estimering av andre relaterte parametere når ingen av denne informasjonen er tilgjengelig.

Siden ikke-parametrisk statistikk gjør færre antakelser om prøvedataene, er anvendelsen bredere enn parametrisk statistikk. I tilfeller der parametrisk testing er mer hensiktsmessig, vil ikke-parametriske metoder være mindre effektive. Dette er fordi ikke-parametrisk statistikk forkaster noe informasjon som er tilgjengelig i dataene, i motsetning til parametrisk statistikk.

Vanlige ikke-parametriske tester inkluderer Chi-Square,. Wilcoxon rank-sum test,. Kruskal-Wallis test og Spearmans rank-rekkefølge korrelasjon.

Eksempler på den ikke-parametriske metoden

Vurder en finansanalytiker som ønsker å estimere verdien-at-risk (VaR) til en investering. Analytikeren samler inn inntektsdata fra hundrevis av lignende investeringer over en lignende tidshorisont. I stedet for å anta at inntjeningen følger en normalfordeling, bruker hun histogrammet til å estimere fordelingen ikke-parametrisk. Den 5. persentilen til dette histogrammet gir deretter analytikeren et ikke-parametrisk estimat av VaR.

For et annet eksempel, tenk på en annen forsker som ønsker å vite om gjennomsnittlige timers søvn er knyttet til hvor ofte man blir syk. Fordi mange mennesker blir syke sjelden, om i det hele tatt, og av og til blir andre syke langt oftere enn de fleste andre, er fordelingen av sykdomshyppigheten klart ikke-normal, rettskjev og utsatt for avvik.

I stedet for å bruke en metode som forutsetter en normalfordeling for sykdomsfrekvens, slik det for eksempel gjøres i klassisk regresjonsanalyse, bestemmer forskeren seg for å bruke en ikke-parametrisk metode som kvantilregresjonsanalyse.

##Høydepunkter

– Dette i motsetning til parametriske metoder, som gjør antakelser om formen eller egenskapene til dataene. Eksempler på slike metoder inkluderer normalfordelingsmodellen og den lineære regresjonsmodellen.

– Den ikke-parametriske metoden er en gren av statistikken der dataene ikke antas å komme fra foreskrevne modeller som er bestemt av et lite antall parametere.

Den ikke-parametriske analysen er ofte best egnet når man vurderer rekkefølgen til noe, der selv om de numeriske dataene endres, vil resultatene sannsynligvis forbli de samme.