Analiza wariancji (ANOVA)
Co to jest analiza wariancji (ANOVA)?
Analiza wariancji (ANOVA) to narzędzie analityczne używane w statystyce, które dzieli obserwowaną zagregowaną zmienność znalezioną w zbiorze danych na dwie części: czynniki systematyczne i czynniki losowe. Czynniki systematyczne mają statystyczny wpływ na dany zbiór danych, natomiast czynniki losowe nie. Analitycy używają testu ANOVA do określenia wpływu zmiennych niezależnych na zmienną zależną w badaniu regresji.
metody t i z były wykorzystywane do analizy statystycznej do 1918 roku, kiedy to Ronald Fisher stworzył metodę analizy wariancji. ANOVA jest również nazywana analizą wariancji Fishera i jest rozszerzeniem testów t i z. Termin stał się dobrze znany w 1925 roku, po pojawieniu się w książce Fishera „Metody statystyczne dla pracowników naukowych”. Została wykorzystana w psychologii eksperymentalnej, a później rozszerzona na przedmioty, które były bardziej złożone.
Formuła ANOVA to:
Co ujawnia analiza wariancji?
Test ANOVA jest pierwszym krokiem w analizie czynników wpływających na dany zestaw danych. Po zakończeniu testu analityk przeprowadza dodatkowe testy na czynnikach metodycznych, które w wymierny sposób przyczyniają się do niespójności zbioru danych. Analityk wykorzystuje wyniki testu ANOVA w teście f do generowania dodatkowych danych zgodnych z proponowanymi modelami regresji .
Test ANOVA umożliwia porównanie więcej niż dwóch grup jednocześnie w celu określenia, czy istnieje między nimi związek. Wynik formuły ANOVA, statystyka F (zwana również współczynnikiem F), pozwala na analizę wielu grup danych w celu określenia zmienności między próbkami i w próbkach.
Jeśli nie ma rzeczywistej różnicy między testowanymi grupami, co nazywa się hipotezą zerową,. wynik statystyki współczynnika F ANOVA będzie bliski 1. Rozkład wszystkich możliwych wartości statystyki F jest rozkładem F. W rzeczywistości jest to grupa funkcji rozkładu, z dwoma charakterystycznymi liczbami, zwanymi stopniami swobody licznika i mianownikiem stopni swobody.
Przykład użycia ANOVA
Badacz może na przykład przetestować studentów z wielu uczelni, aby sprawdzić, czy studenci z jednej z uczelni konsekwentnie osiągają lepsze wyniki niż studenci z innych uczelni. W aplikacji biznesowej badacz R&D może przetestować dwa różne procesy tworzenia produktu, aby sprawdzić, czy jeden proces jest lepszy od drugiego pod względem efektywności kosztowej.
Rodzaj użytego testu ANOVA zależy od wielu czynników. Jest stosowany, gdy dane muszą być eksperymentalne. Analiza wariancji jest stosowana, gdy nie ma dostępu do oprogramowania statystycznego, w wyniku którego ręcznie oblicza się ANOVA. Jest prosty w użyciu i najlepiej nadaje się do małych próbek. W przypadku wielu projektów eksperymentalnych wielkości próbek muszą być takie same dla różnych kombinacji poziomów czynników.
ANOVA jest pomocna przy testowaniu trzech lub więcej zmiennych. Jest podobny do wielokrotnych testów t dla dwóch próbek. Powoduje to jednak mniej błędów typu I i jest odpowiednie dla szeregu problemów. ANOVA grupuje różnice przez porównanie średnich z każdej grupy i obejmuje rozłożenie wariancji na różne źródła. Jest stosowany z podmiotami, grupami testowymi, między grupami i wewnątrz grup.
Jednokierunkowa ANOVA kontra dwukierunkowa ANOVA
Istnieją dwa główne typy ANOVA: jednokierunkowe (lub jednokierunkowe) i dwukierunkowe. Istnieją również odmiany ANOVA. Na przykład MANOVA (wieloczynnikowa ANOVA) różni się od ANOVA tym, że pierwsza testuje wiele zmiennych zależnych jednocześnie, podczas gdy druga ocenia tylko jedną zmienną zależną na raz. Jednoczynnikowy lub dwuczynnikowy odnosi się do liczby zmiennych niezależnych w analizie testu wariancji. Jednoczynnikowa ANOVA ocenia wpływ jedynego czynnika na jedyną zmienną odpowiedzi. Określa, czy wszystkie próbki są takie same. Jednoczynnikową ANOVA stosuje się do określenia, czy istnieją jakiekolwiek statystycznie istotne różnice między średnimi trzech lub więcej niezależnych (niespokrewnionych) grup.
Dwukierunkowa ANOVA jest rozszerzeniem jednokierunkowej ANOVA. W jeden sposób masz jedną niezależną zmienną wpływającą na zmienną zależną. W przypadku dwukierunkowej analizy ANOVA istnieją dwie niezależne wartości. Na przykład dwukierunkowa ANOVA umożliwia firmie porównanie wydajności pracowników na podstawie dwóch niezależnych zmiennych, takich jak wynagrodzenie i zestaw umiejętności. Służy do obserwowania interakcji między dwoma czynnikami i jednoczesnego testowania wpływu dwóch czynników.
##Przegląd najważniejszych wydarzeń
Jeśli między grupami nie ma prawdziwej wariancji, współczynnik F ANOVA powinien być bliski 1.
Jednoczynnikowa analiza ANOVA jest stosowana dla trzech lub więcej grup danych w celu uzyskania informacji o relacji między zmienną zależną i niezależną.
Analiza wariancji, czyli ANOVA, to metoda statystyczna, która rozdziela zaobserwowane dane o wariancji na różne składniki do wykorzystania w dodatkowych testach.