Wielokoliniowość
Co to jest współliniowość?
Wielokolinearność to występowanie wysokich interkorelacji między dwiema lub więcej zmiennymi niezależnymi w modelu regresji wielorakiej. Wielokoliniowość może prowadzić do wypaczonych lub mylących wyników, gdy badacz lub analityk próbuje określić, jak dobrze każda zmienna niezależna może być najskuteczniej wykorzystana do przewidywania lub zrozumienia zmiennej zależnej w modelu statystycznym.
Ogólnie rzecz biorąc, wielowspółliniowość może prowadzić do szerszych przedziałów ufności,. które dają mniej wiarygodne prawdopodobieństwa pod względem wpływu zmiennych niezależnych w modelu.
Zrozumienie współliniowości
Analitycy statystyczni wykorzystują modele regresji wielokrotnej do przewidywania wartości określonej zmiennej zależnej na podstawie wartości dwóch lub więcej zmiennych niezależnych. Zmienna zależna jest czasami określana jako zmienna wynikowa, docelowa lub kryterium.
Przykładem jest wielowymiarowy model regresji, który próbuje przewidzieć zwroty z akcji na podstawie takich pozycji, jak wskaźniki ceny do zysków (wskaźniki P/E), kapitalizacja rynkowa, wyniki z przeszłości lub inne dane. Zwrot z akcji jest zmienną zależną, a różne fragmenty danych finansowych są zmiennymi niezależnymi.
Wielokoliniowość w modelu regresji wielorakiej wskazuje, że współliniowe zmienne niezależne są w pewien sposób powiązane, chociaż zależność może być przypadkowa lub nie. Na przykład wyniki osiągane w przeszłości mogą być związane z kapitalizacją rynkową,. ponieważ akcje, które osiągały dobre wyniki w przeszłości, będą miały coraz większą wartość rynkową.
Innymi słowy, współliniowość może istnieć, gdy dwie niezależne zmienne są silnie skorelowane. Może się to również zdarzyć, jeśli zmienna niezależna jest obliczona z innych zmiennych w zestawie danych lub jeśli dwie zmienne niezależne dają podobne i powtarzalne wyniki.
Uwagi specjalne
Jednym z najczęstszych sposobów wyeliminowania problemu współliniowości jest najpierw identyfikacja współliniowych zmiennych niezależnych, a następnie usunięcie wszystkich oprócz jednej.
Istnieje również możliwość wyeliminowania współliniowości poprzez połączenie dwóch lub więcej zmiennych współliniowych w jedną zmienną. Następnie można przeprowadzić analizę statystyczną w celu zbadania związku między określoną zmienną zależną a tylko jedną zmienną niezależną.
Wnioskowania statystyczne z modelu, który zawiera współliniowość, mogą nie być wiarygodne.
Przykłady współliniowości
###Inwestowanie
W przypadku inwestowania, współliniowość jest częstą kwestią podczas przeprowadzania analizy technicznej w celu przewidzenia prawdopodobnych przyszłych zmian cen papieru wartościowego, takiego jak akcje lub kontrakt terminowy na towary.
Analitycy rynkowi chcą uniknąć używania wskaźników technicznych, które są współliniowe, ponieważ opierają się na bardzo podobnych lub powiązanych danych wejściowych; mają tendencję do ujawniania podobnych przewidywań dotyczących zmiennej zależnej ruchu cen. Zamiast tego analiza rynku musi opierać się na znacząco różnych zmiennych niezależnych, aby zapewnić, że analizują rynek z różnych niezależnych punktów widzenia analitycznego.
Przykładem potencjalnego problemu współliniowości jest wykonanie analizy technicznej tylko przy użyciu kilku podobnych wskaźników.
Znany analityk techniczny John Bollinger, twórca wskaźnika Bollinger Bands,. zauważa, że „kardynalna zasada skutecznego wykorzystania analizy technicznej wymaga unikania wielokoliniowości wśród wskaźników”. Aby rozwiązać problem, analitycy unikają używania dwóch lub więcej wskaźników technicznych tego samego typu. Zamiast tego analizują papier wartościowy przy użyciu jednego rodzaju wskaźnika, takiego jak wskaźnik momentum, a następnie przeprowadzają oddzielną analizę przy użyciu innego typu wskaźnika, takiego jak wskaźnik trendu.
Na przykład stochastyka,. względny wskaźnik siły (RSI) i Williams %R są wskaźnikami momentum, które opierają się na podobnych danych wejściowych i prawdopodobnie dadzą podobne wyniki. W takim przypadku lepiej jest usunąć wszystkie wskaźniki oprócz jednego lub znaleźć sposób na połączenie kilku z nich w jeden wskaźnik, jednocześnie dodając wskaźnik trendu, który prawdopodobnie nie będzie silnie skorelowany ze wskaźnikiem momentum.
###W biologii
Wielokoliniowość obserwuje się również w wielu innych kontekstach. Jednym z takich kontekstów jest biologia człowieka. Na przykład ciśnienie krwi danej osoby nie jest współliniowe z wiekiem, ale także z wagą, stresem i tętnem.
##Przegląd najważniejszych wydarzeń
Wielowspółliniowość to koncepcja statystyczna, w której kilka niezależnych zmiennych w modelu jest skorelowanych.
Wielowspółliniowość między zmiennymi niezależnymi spowoduje mniej wiarygodnych wniosków statystycznych.
Lepiej jest używać zmiennych niezależnych, które nie są skorelowane ani powtarzalne, gdy buduje się modele regresji wielokrotnej, które wykorzystują dwie lub więcej zmiennych.
Dwie zmienne są uważane za idealnie współliniowe, jeśli ich współczynnik korelacji wynosi +/- 1,0.
Istnienie współliniowości w zbiorze danych może prowadzić do mniej wiarygodnych wyników ze względu na większe błędy standardowe.
##FAQ
Dlaczego wielokoliniowość jest problemem?
Wielowspółliniowość stanowi problem, ponieważ daje wyniki modelu regresji, które są mniej wiarygodne. Wynika to z szerszych przedziałów ufności (większe błędy standardowe ), które mogą obniżyć istotność statystyczną współczynników regresji.
Jak radzić sobie z wielokolinearnością?
Aby zmniejszyć wielkość współliniowości znalezionej w modelu, można usunąć określone zmienne, które zostały zidentyfikowane jako najbardziej współliniowe. Możesz również spróbować połączyć lub przekształcić naruszające zmienne, aby obniżyć ich korelację. Jeśli to nie działa lub jest nieosiągalne, istnieją zmodyfikowane modele regresji, które lepiej radzą sobie z wielowspółliniowością, takie jak regresja grzbietowa, regresja głównych składowych lub regresja metodą częściowych najmniejszych kwadratów.
Jak wykryć wielokoliniowość?
Technika statystyczna zwana współczynnikiem inflacji wariancji (VIF) służy do wykrywania i pomiaru stopnia współliniowości w modelu regresji wielorakiej.
Czym jest idealna kolinearność?
Idealna kolinearność występuje, gdy istnieje dokładna zgodność 1:1 między dwiema zmiennymi niezależnymi w modelu. Może to być korelacja +1,0 lub -1,0.