Statystyki nieparametryczne
Czym s膮 statystyki nieparametryczne?
Statystyka nieparametryczna odnosi si臋 do metody statystycznej, w kt贸rej nie zak艂ada si臋, 偶e dane pochodz膮 z zalecanych modeli, kt贸re s膮 okre艣lone przez niewielk膮 liczb臋 parametr贸w; przyk艂adami takich modeli s膮 model rozk艂adu normalnego i model regresji liniowej. Statystyki nieparametryczne czasami wykorzystuj膮 dane porz膮dkowe, co oznacza, 偶e nie opieraj膮 si臋 na liczbach, ale raczej na rankingu lub kolejno艣ci sortowania. Na przyk艂ad ankieta przedstawiaj膮ca preferencje konsument贸w, od upodoba艅 do niech臋ci, by艂aby uwa偶ana za dane porz膮dkowe.
Statystyki nieparametryczne obejmuj膮 nieparametryczne statystyki opisowe,. modele statystyczne, wnioskowanie i testy statystyczne. Struktura modelu modeli nieparametrycznych nie jest okre艣lona a priori, lecz jest okre艣lana na podstawie danych. Termin nieparametryczny nie ma na celu sugerowania, 偶e takie modele s膮 ca艂kowicie pozbawione parametr贸w, ale raczej, 偶e liczba i charakter parametr贸w s膮 elastyczne i nie s膮 z g贸ry ustalone. Histogram jest przyk艂adem nieparametrycznego oszacowania rozk艂adu prawdopodobie艅stwa.
Zrozumienie statystyk nieparametrycznych
W statystyce statystyki parametryczne obejmuj膮 parametry, takie jak 艣rednia, odchylenie standardowe, korelacja Pearsona, wariancja itp. Ta forma statystyki wykorzystuje obserwowane dane do oszacowania parametr贸w rozk艂adu. W statystyce parametrycznej cz臋sto zak艂ada si臋, 偶e dane pochodz膮 z rozk艂adu normalnego o nieznanych parametrach 渭 (艣rednia populacji) i 蟽2 (wariancja populacji), kt贸re s膮 nast臋pnie szacowane przy u偶yciu 艣redniej pr贸bki i wariancji pr贸bki.
Statystyki nieparametryczne nie zak艂adaj膮 wielko艣ci pr贸by ani tego, czy obserwowane dane s膮 ilo艣ciowe.
Statystyka nieparametryczna nie zak艂ada, 偶e dane pochodz膮 z rozk艂adu normalnego. Zamiast tego kszta艂t rozk艂adu jest szacowany w tej formie pomiaru statystycznego. Chocia偶 istnieje wiele sytuacji, w kt贸rych mo偶na za艂o偶y膰 rozk艂ad normalny, istniej膮 r贸wnie偶 scenariusze, w kt贸rych prawdziwy proces generowania danych jest daleki od rozk艂adu normalnego.
Przyk艂ady statystyk nieparametrycznych
W pierwszym przyk艂adzie rozwa偶my analityka finansowego, kt贸ry chce oszacowa膰 warto艣膰 zagro偶on膮 (VaR) inwestycji. Analityk zbiera dane o zarobkach ze 100 podobnych inwestycji w podobnym horyzoncie czasowym. Zamiast zak艂ada膰, 偶e zarobki maj膮 rozk艂ad normalny, u偶ywaj膮 histogramu do nieparametrycznego oszacowania rozk艂adu. Pi膮ty percentyl tego histogramu dostarcza analitykowi nieparametrycznego oszacowania VaR.
Jako drugi przyk艂ad rozwa偶my innego badacza, kt贸ry chce wiedzie膰, czy 艣rednia liczba godzin snu jest zwi膮zana z cz臋stotliwo艣ci膮 zachorowania. Poniewa偶 wiele os贸b choruje rzadko, je艣li w og贸le, a od czasu do czasu inni choruj膮 znacznie cz臋艣ciej ni偶 wi臋kszo艣膰 innych, rozk艂ad cz臋stotliwo艣ci zachorowa艅 jest wyra藕nie nienormalny, jest przekrzywiony w prawo i podatny na warto艣ci odstaj膮ce. Dlatego zamiast stosowa膰 metod臋, kt贸ra zak艂ada rozk艂ad normalny cz臋sto艣ci wyst臋powania chor贸b, jak ma to miejsce na przyk艂ad w klasycznej analizie regresji, badacz decyduje si臋 na zastosowanie metody nieparametrycznej, takiej jak analiza regresji kwantyli.
Uwagi specjalne
Statystyki nieparametryczne zyska艂y uznanie ze wzgl臋du na 艂atwo艣膰 ich u偶ycia. W miar臋 zmniejszania si臋 zapotrzebowania na parametry dane staj膮 si臋 bardziej przydatne do wi臋kszej r贸偶norodno艣ci test贸w. Ten rodzaj statystyk mo偶e by膰 u偶ywany bez 艣redniej, wielko艣ci pr贸by, odchylenia standardowego lub szacowania jakichkolwiek innych powi膮zanych parametr贸w, gdy 偶adna z tych informacji nie jest dost臋pna.
Poniewa偶 statystyka nieparametryczna zawiera mniej za艂o偶e艅 dotycz膮cych danych pr贸bki, jej zastosowanie ma szerszy zakres ni偶 statystyka parametryczna. W przypadkach, w kt贸rych bardziej odpowiednie jest testowanie parametryczne, metody nieparametryczne b臋d膮 mniej wydajne. Dzieje si臋 tak, poniewa偶 statystyki nieparametryczne odrzucaj膮 niekt贸re informacje dost臋pne w danych, w przeciwie艅stwie do statystyk parametrycznych.
##Przegl膮d najwa偶niejszych wydarze艅
Ten rodzaj analizy cz臋sto najlepiej sprawdza si臋 przy rozwa偶aniu kolejno艣ci czego艣, gdzie nawet je艣li dane liczbowe ulegn膮 zmianie, wyniki prawdopodobnie pozostan膮 takie same.
Statystyki nieparametryczne s膮 艂atwe w u偶yciu, ale nie zapewniaj膮 dok艂adnej dok艂adno艣ci innych modeli statystycznych.