Ei-parametrinen menetelmä

Mikä on ei-parametrinen menetelmä?

Ei-parametrisella menetelmällä tarkoitetaan tilastotyyppiä, joka ei tee oletuksia otoksen (sen parametrien) ominaisuuksista tai siitä, onko havaittu data kvantitatiivista vai kvalitatiivista.

Ei-parametriset tilastot voivat sisältää tiettyjä kuvaavia tilastoja,. tilastollisia malleja, päätelmiä ja tilastollisia testejä. Ei-parametristen menetelmien mallirakennetta ei ole määritelty a priori, vaan se määritetään tiedoista.

Termi "ei-parametrinen" ei tarkoita sitä, että tällaisilta malleilta puuttuisi täysin parametreja, vaan että parametrien lukumäärä ja luonne ovat joustavia eikä niitä ole vahvistettu etukäteen. Histogrammi on esimerkki todennäköisyysjakauman ei-parametrisesta estimaatista.

Sitä vastoin tunnetut tilastolliset menetelmät, kuten ANOVA,. Pearsonin korrelaatio,. t-testi ja muut, tekevät oletuksia analysoitavista tiedoista. Yksi yleisimmistä parametrisista oletuksista on, että väestötiedoilla on " normaalijakauma ".

Kuinka ei-parametrinen menetelmä toimii

Parametrisia ja ei-parametrisiä menetelmiä käytetään usein erityyppisissä tiedoissa. Parametriset tilastot vaativat yleensä intervalli- tai suhdetietoja. Esimerkki tällaisesta tiedosta on ikä, tulot, pituus ja paino, joissa arvot ovat jatkuvia ja arvojen välisillä aikaväleillä on merkitystä.

Sitä vastoin ei-parametrisia tilastoja käytetään tyypillisesti tiedoissa, jotka ovat nimellisiä tai järjestyslukuja. Nimelliset muuttujat ovat muuttujia, joiden arvoilla ei ole kvantitatiivisia arvoja. Yhteiskuntatieteellisen tutkimuksen yleisiä nimellismuuttujia ovat esimerkiksi sukupuoli, jonka mahdolliset arvot ovat erilliset kategoriat, "mies" ja "nainen". Muita yhteiskuntatieteellisen tutkimuksen yhteisiä nimellismuuttujia ovat rotu, siviilisääty, koulutustaso ja työllisyystilanne (työllinen vs. työtön).

Järjestysmuuttujat ovat niitä, joissa arvo viittaa johonkin järjestykseen. Esimerkki järjestysmuuttujasta olisi, jos kyselyyn vastaaja kysyisi: "Miten arvioisit kokemuksesi kaapeliyhtiöstä asteikolla 1-5, jossa 1 on erittäin tyytymätön ja 5 erittäin tyytyväinen?"

Parametrista tilastoa voidaan kuitenkin soveltaa myös populaatioihin, joilla on muita tunnettuja jakautumistyyppejä. Ei-parametriset tilastot eivät edellytä, että väestötiedot täyttävät parametrisissä tilastoissa vaaditut oletukset. Ei-parametriset tilastot kuuluvat siksi tilastoluokkaan, jota joskus kutsutaan jakeluvapaiksi. Usein ei-parametrisia menetelmiä käytetään, kun populaatiodatalla on tuntematon jakauma tai kun otoskoko on pieni.

Erityisiä huomioita

Vaikka ei-parametristen tilastojen etuna on, että niiden on täytettävä muutamia oletuksia, ne ovat vähemmän tehokkaita kuin parametriset tilastot. Tämä tarkoittaa, että ne eivät välttämättä näytä suhdetta kahden muuttujan välillä, vaikka sellainen on olemassa.

Ei-parametriset tilastot ovat saaneet arvostusta niiden helppokäyttöisyyden vuoksi. Kun parametrien tarve vähenee, data soveltuu entistä laajemmalle valikoimalle testejä. Tämän tyyppisiä tilastoja voidaan käyttää ilman keskiarvoa, otoskokoa, keskihajontaa tai muiden asiaan liittyvien parametrien estimointia, kun mitään näistä tiedoista ei ole saatavilla.

Koska ei-parametriset tilastot tekevät vähemmän oletuksia otostiedoista, sen käyttöalue on laajempi kuin parametristen tilastojen. Tapauksissa, joissa parametrinen testaus on sopivampi, ei-parametriset menetelmät ovat vähemmän tehokkaita. Tämä johtuu siitä, että ei-parametriset tilastot hylkäävät osan tiedoissa saatavilla olevista tiedoista, toisin kuin parametriset tilastot.

Yleisiä ei-parametrisia testejä ovat Chi-Square,. Wilcoxon rank-sum testi,. Kruskal-Wallis -testi ja Spearmanin järjestyskorrelaatio.

Esimerkkejä ei-parametrisesta menetelmästä

Harkitse rahoitusanalyytikkoa, joka haluaa arvioida sijoituksen Value-at-risk-arvon (VaR). Analyytikko kerää tulostietoja sadoista samankaltaisista sijoituksista samalla aikahorisontilla. Sen sijaan, että olettaisi, että tulot noudattavat normaalijakaumaa, hän käyttää histogrammia jakauman arvioimiseen ei-parametrisesti. Tämän histogrammin 5. prosenttipiste antaa sitten analyytikolle ei-parametrisen VaR-estimaatin.

Toisessa esimerkissä harkitse toista tutkijaa, joka haluaa tietää, onko keskimääräinen unitunti yhdistetty sairastumistiheyteen. Koska monet ihmiset sairastuvat harvoin, jos ollenkaan, ja satunnaisesti toiset sairastuvat paljon useammin kuin useimmat muut, sairauden esiintymistiheyden jakauma on selvästi epänormaali, oikealle vino ja poikkeaville altis.

Siten sen sijaan, että käyttäisivät menetelmää, joka olettaa sairauden esiintymistiheyden normaalijakauman, kuten tehdään esimerkiksi klassisessa regressioanalyysissä, tutkija päättää käyttää ei-parametrista menetelmää, kuten kvantiiliregressioanalyysiä.

##Kohokohdat

Tämä eroaa parametrisista menetelmistä, jotka tekevät oletuksia datan muodosta tai ominaisuuksista. Esimerkkejä tällaisista menetelmistä ovat normaalijakaumamalli ja lineaarinen regressiomalli.
Ei-parametrinen menetelmä on tilaston haara, jossa tietojen ei oletetaan olevan määrätyistä malleista, jotka määritetään pienellä määrällä parametreja.
Ei-parametrinen analyysi soveltuu usein parhaiten jonkin järjestyksen tarkastelussa, jossa vaikka numeerinen data muuttuisi, tulokset todennäköisesti pysyvät ennallaan.