Znaczenie statystyczne
Co to jest istotność statystyczna?
Istotność statystyczna odnosi się do twierdzenia, że zbiór zaobserwowanych danych nie jest wynikiem przypadku, lecz może być przypisany konkretnej przyczynie. Znaczenie statystyczne jest ważne dla dyscyplin akademickich lub praktyków, którzy w dużym stopniu opierają się na analizie danych i badań, takich jak ekonomia, finanse,. inwestowanie,. medycyna, fizyka i biologia.
Znaczenie statystyczne można uznać za silne lub słabe. Podczas analizowania zestawu danych i przeprowadzania niezbędnych testów w celu rozeznania, czy jedna lub więcej zmiennych ma wpływ na wynik, silna istotność statystyczna pomaga potwierdzić fakt, że wyniki są prawdziwe i nie są spowodowane szczęściem lub przypadkiem. Mówiąc prosto, jeśli wartość p jest mała, wynik jest uważany za bardziej wiarygodny.
Problemy pojawiają się w testach istotności statystycznej, ponieważ badacze zwykle pracują na próbach większych populacji, a nie na samych populacjach. W rezultacie próbki muszą być reprezentatywne dla populacji, więc dane zawarte w próbie nie mogą być w żaden sposób stronnicze. W większości nauk, w tym w ekonomii, wynik można uznać za istotny statystycznie, jeśli ma poziom ufności 95% (a czasami 99%).
Zrozumienie istotności statystycznej
Obliczanie istotności statystycznej (testowanie istotności) jest obarczone pewnym błędem. Nawet jeśli dane wydają się mieć silny związek, badacze muszą uwzględnić możliwość, że pozorna korelacja powstała z powodu losowego przypadku lub błędu próbkowania.
Wielkość próby jest ważnym składnikiem istotności statystycznej, ponieważ większe próbki są mniej podatne na przywry. Do badania istotności należy używać wyłącznie losowo wybranych, reprezentatywnych próbek . Poziom, na którym można zaakceptować, czy zdarzenie jest istotne statystycznie,. nazywany jest poziomem istotności.
Badacze używają pomiaru znanego jako wartość p, aby określić istotność statystyczną: jeśli wartość p spada poniżej poziomu istotności, wynik jest istotny statystycznie. Wartość p jest funkcją średnich i odchyleń standardowych próbek danych.
Wartość p wskazuje prawdopodobieństwo wystąpienia danego wyniku statystycznego przy założeniu, że za wynik odpowiada sama szansa. Jeśli to prawdopodobieństwo jest małe, to badacz może dojść do wniosku, że za obserwowane dane może odpowiadać inny czynnik.
Przeciwieństwem poziomu istotności, obliczonego jako 1 minus poziom istotności, jest poziom ufności. Wskazuje stopień ufności, że wynik statystyczny nie pojawił się przypadkowo lub przez błąd próbkowania. Zwyczajowy poziom ufności w wielu testach statystycznych wynosi 95%, co prowadzi do zwyczajowego poziomu istotności lub wartości p 5%.
„P-hacking” to praktyka wyczerpującego porównywania wielu różnych zestawów danych w poszukiwaniu statystycznie istotnego wyniku. Podlega to stronniczości raportowania, ponieważ naukowcy zgłaszają tylko pozytywne wyniki, a nie negatywne.
Uwagi specjalne
Znaczenie statystyczne nie zawsze wskazuje na znaczenie praktyczne, co oznacza, że wyników nie można zastosować w rzeczywistych sytuacjach biznesowych. Ponadto istotność statystyczna może zostać błędnie zinterpretowana, gdy badacze nie używają ostrożnie języka w raportowaniu swoich wyników. Fakt, że wynik jest statystycznie istotny, nie oznacza, że nie jest wynikiem przypadku, tylko że jest to mniej prawdopodobne.
Tylko dlatego, że dwie serie danych utrzymują ze sobą silną korelację, nie implikuje związku przyczynowego. Na przykład liczba filmów, w których w danym roku występuje aktor Nicolas Cage, jest bardzo silnie skorelowana z liczbą przypadkowych utonięć w basenach. Ale ta korelacja jest fałszywa,. ponieważ nie można sformułować teoretycznego twierdzenia o przyczynie.
Innym problemem, który może pojawić się w przypadku istotności statystycznej, jest to, że dane z przeszłości i wyniki z tych danych, niezależnie od tego, czy są istotne statystycznie, czy nie, mogą nie odzwierciedlać bieżących lub przyszłych warunków. W inwestowaniu może to przejawiać się w modelu cenowym załamującym się w czasach kryzysu finansowego, ponieważ zmieniają się korelacje i zmienne nie wchodzą w interakcje, jak zwykle. Znaczenie statystyczne może również pomóc inwestorowi w ustaleniu, czy jeden model wyceny aktywów jest lepszy od drugiego.
Rodzaje testów istotności statystycznej
W zależności od prowadzonych badań stosuje się kilka rodzajów testów istotności. Na przykład testy można zastosować dla jednej, dwóch lub więcej próbek danych o różnych rozmiarach dla średnich, wariancji, proporcji, danych sparowanych lub niesparowanych lub różnych rozkładów danych.
Istnieją również różne podejścia do testowania istotności, w zależności od rodzaju dostępnych danych. Ronaldowi Fisherowi przypisuje się sformułowanie jednego z najbardziej elastycznych podejść, a także ustalenie normy istotności na p < 0,05. Ponieważ większość prac można wykonać już po zebraniu danych, metoda ta pozostaje popularna w przypadku krótkoterminowych lub doraźnych projektów badawczych.
Chcąc wykorzystać metodę Fishera, Jerzy Neyman i Egon Pearson opracowali alternatywne podejście. Ta metoda wymaga wykonania większej ilości pracy przed zebraniem danych, ale pozwala naukowcom zaprojektować badanie w sposób, który kontroluje prawdopodobieństwo dojścia do fałszywych wniosków.
Testowanie hipotezy zerowej
Istotność statystyczna jest używana w testowaniu hipotezy zerowej, w której badacze próbują poprzeć swoje teorie, odrzucając inne wyjaśnienia. Chociaż metoda ta jest czasami źle rozumiana, pozostaje najpopularniejszą metodą testowania danych w medycynie, psychologii i innych dziedzinach.
Najczęstszą hipotezą zerową jest to, że dany parametr jest równy zero (zazwyczaj wskazując, że zmienna ma zerowy wpływ na wynik zainteresowania). Jeśli badacze odrzucą hipotezę zerową z ufnością 95% lub lepszą, mogą twierdzić, że zaobserwowana zależność jest statystycznie istotna. Hipotezy zerowe można również przetestować pod kątem równości efektu dla dwóch lub więcej alternatywnych metod leczenia.
Wbrew powszechnemu nieporozumieniu, wysoki poziom istotności statystycznej nie może udowodnić, że hipoteza jest prawdziwa lub fałszywa. W rzeczywistości istotność statystyczna mierzy prawdopodobieństwo wystąpienia obserwowanego wyniku, przy założeniu, że hipoteza zerowa jest prawdziwa.
Odrzucenie hipotezy zerowej, nawet jeśli bardzo wysoki stopień istotności statystycznej nigdy nie może udowodnić czegoś, może jedynie wzmocnić istniejącą hipotezę. Z drugiej strony nieodrzucenie hipotezy zerowej jest często podstawą do odrzucenia hipotezy.
Dodatkowo efekt może być statystycznie istotny, ale ma bardzo niewielki wpływ. Na przykład może być statystycznie istotne, że firmy, które używają dwuwarstwowego papieru toaletowego w swoich łazienkach, mają bardziej produktywnych pracowników, ale poprawa bezwzględnej produktywności każdego pracownika będzie prawdopodobnie minimalna.
Korekta – 15 maja 2022 r.: Ten artykuł został zredagowany w celu podkreślenia potencjalnych błędów w testowaniu istotności.
##Przegląd najważniejszych wydarzeń
Istotność statystyczna odnosi się do twierdzenia, że wynik z danych uzyskanych w wyniku testów lub eksperymentów można przypisać konkretnej przyczynie.
Obliczenie istotności statystycznej jest obarczone pewnym błędem.
Wysoki stopień istotności statystycznej wskazuje, że obserwowany związek prawdopodobnie nie jest przypadkowy.
W zależności od prowadzonych badań stosuje się kilka rodzajów testów istotności.
Znaczenie statystyczne może zostać błędnie zinterpretowane, gdy badacze nie używają ostrożnie języka w przedstawianiu wyników.