Metoda nieparametryczna

Co to jest metoda nieparametryczna?

Metoda nieparametryczna odnosi się do rodzaju statystyki, która nie przyjmuje żadnych założeń dotyczących cech próby (jej parametrów) ani tego, czy obserwowane dane są ilościowe czy jakościowe.

Statystyki nieparametryczne mogą obejmować określone statystyki opisowe,. modele statystyczne, wnioskowanie i testy statystyczne. Struktura modelu metod nieparametrycznych nie jest określona a priori, lecz jest określana na podstawie danych.

Termin „nieparametryczny” nie oznacza, że takie modele są całkowicie pozbawione parametrów, ale raczej, że liczba i charakter parametrów są elastyczne i nie są z góry ustalone. Histogram jest przykładem nieparametrycznego oszacowania rozkładu prawdopodobieństwa.

W przeciwieństwie do tego, dobrze znane metody statystyczne, takie jak ANOVA,. korelacja Pearsona,. test t,. i inne robią założenia dotyczące analizowanych danych. Jednym z najczęstszych założeń parametrycznych jest to, że dane dotyczące populacji mają „ rozkład normalny ”.

Jak działa metoda nieparametryczna

Metody parametryczne i nieparametryczne są często stosowane do różnych typów danych. Statystyki parametryczne zazwyczaj wymagają danych interwałowych lub ilorazowych. Przykładem tego typu danych jest wiek, dochód, wzrost i waga, w których wartości są ciągłe, a odstępy między wartościami mają znaczenie.

W przeciwieństwie do tego, statystyki nieparametryczne są zwykle używane dla danych, które są nominalne lub porządkowe. Zmienne nominalne to zmienne, dla których wartości nie mają wartości ilościowych. Na przykład wspólne zmienne nominalne w badaniach w naukach społecznych obejmują płeć, której możliwymi wartościami są odrębne kategorie, „mężczyzna” i „kobieta”. Innymi wspólnymi zmiennymi nominalnymi w badaniach w naukach społecznych są rasa, stan cywilny, poziom wykształcenia i status zatrudnienia (zatrudniony vs bezrobotny).

Zmienne porządkowe to takie, w których wartość sugeruje pewien porządek. Przykładem zmiennej porządkowej byłoby pytanie: „W skali od 1 do 5, gdzie 1 oznacza skrajnie niezadowolony, a 5 oznacza skrajnie zadowolony, jak oceniasz swoje doświadczenia z operatorem telewizji kablowej?”.

Statystyki parametryczne mogą być jednak również stosowane do populacji o innych znanych typach dystrybucji. Statystyki nieparametryczne nie wymagają, aby dane dotyczące populacji spełniały założenia wymagane dla statystyk parametrycznych. Z tego względu statystyki nieparametryczne należą do kategorii statystyk określanych czasem jako wolne od dystrybucji. Często metody nieparametryczne będą stosowane, gdy dane o populacji mają nieznany rozkład lub gdy wielkość próby jest mała.

Uwagi specjalne

Chociaż statystyki nieparametryczne mają tę zaletę, że muszą spełniać kilka założeń, są mniej wydajne niż statystyki parametryczne. Oznacza to, że mogą nie wykazywać związku między dwiema zmiennymi, gdy w rzeczywistości jedna istnieje.

Statystyki nieparametryczne zyskały uznanie ze względu na łatwość ich użycia. W miarę zmniejszania się zapotrzebowania na parametry dane stają się bardziej przydatne do większej różnorodności testów. Ten rodzaj statystyk może być używany bez średniej, wielkości próby, odchylenia standardowego lub szacowania jakichkolwiek innych powiązanych parametrów, gdy żadna z tych informacji nie jest dostępna.

Ponieważ statystyka nieparametryczna zawiera mniej założeń dotyczących danych próbki, jej zastosowanie ma szerszy zakres niż statystyka parametryczna. W przypadkach, w których bardziej odpowiednie jest testowanie parametryczne, metody nieparametryczne będą mniej wydajne. Dzieje się tak, ponieważ statystyki nieparametryczne odrzucają niektóre informacje dostępne w danych, w przeciwieństwie do statystyk parametrycznych.

Popularne testy nieparametryczne obejmują test chi-kwadrat,. test sumy rang Wilcoxona,. test Kruskala-Wallisa oraz korelację rang Spearmana.

Przykłady metody nieparametrycznej

Rozważ analityka finansowego, który chce oszacować wartość zagrożoną (VaR) inwestycji. Analityk zbiera dane o zarobkach z setek podobnych inwestycji w podobnym horyzoncie czasowym. Zamiast zakładać, że zarobki mają rozkład normalny, używa histogramu do nieparametrycznego oszacowania rozkładu. Piąty percentyl tego histogramu dostarcza analitykowi nieparametrycznego oszacowania VaR.

Jako drugi przykład rozważmy innego badacza, który chce wiedzieć, czy średnia liczba godzin snu jest związana z częstotliwością zachorowania. Ponieważ wiele osób choruje rzadko, jeśli w ogóle, a od czasu do czasu inni chorują znacznie częściej niż większość innych, rozkład częstotliwości zachorowań jest wyraźnie nienormalny, jest przekrzywiony w prawo i podatny na wartości odstające.

Dlatego zamiast stosować metodę, która zakłada rozkład normalny częstości występowania chorób, jak ma to miejsce na przykład w klasycznej analizie regresji, badacz decyduje się na zastosowanie metody nieparametrycznej, takiej jak analiza regresji kwantyli.

##Przegląd najważniejszych wydarzeń

Jest to przeciwieństwo metod parametrycznych, które zakładają kształt lub charakterystykę danych. Przykładami takich metod są model rozkładu normalnego i model regresji liniowej.
Metoda nieparametryczna to gałąź statystyki, w której nie zakłada się, że dane pochodzą z zalecanych modeli, które są określane przez niewielką liczbę parametrów.
Analiza nieparametryczna jest często najbardziej odpowiednia przy rozważaniu kolejności czegoś, gdzie nawet jeśli dane liczbowe ulegną zmianie, wyniki prawdopodobnie pozostaną takie same.