Investor's wiki

Omoschedastico

Omoschedastico

Cos'è l'omoschedastico?

Omoschedastico (scritto anche "omoscedastico") si riferisce a una condizione in cui la varianza del termine residuo, o di errore,. in un modello di regressione è costante. Cioè, il termine di errore non varia molto al variare del valore della variabile predittiva. Un altro modo per dirlo è che la varianza dei punti dati è più o meno la stessa per tutti i punti dati.

Ciò suggerisce un livello di coerenza e rende più facile modellare e lavorare con i dati attraverso la regressione; tuttavia, la mancanza di omoschedasticità può suggerire che il modello di regressione potrebbe dover includere variabili predittive aggiuntive per spiegare la performance della variabile dipendente.

Come funziona l'omoschedasticità

L'omoschedasticità è un presupposto della modellazione li near regression ei dati di questo tipo funzionano bene con il metodo dei minimi quadrati. Se la varianza degli errori attorno alla retta di regressione varia molto, il modello di regressione potrebbe essere poco definito.

L'opposto dell'omoschedasticità è l'eteroschedasticità proprio come l'opposto di "omogeneo" è "eterogeneo". L'eteroschedasticità (scritto anche "eteroscedasticità") si riferisce a una condizione in cui la varianza del termine di errore in un'equazione di regressione non è costante.

Considerazioni speciali

Un semplice modello di regressione, o equazione, è costituito da quattro termini. Sul lato sinistro c'è la variabile dipendente. Rappresenta il fenomeno che il modello cerca di "spiegare". Sul lato destro ci sono una costante, una variabile predittiva e un termine residuo, o errore. Il termine di errore mostra la quantità di variabilità nella variabile dipendente che non è spiegata dalla variabile predittiva.

Esempio di omoschedastico

Ad esempio, supponi di voler spiegare i punteggi dei test degli studenti utilizzando la quantità di tempo che ciascuno studente ha trascorso a studiare. In questo caso, i punteggi del test sarebbero la variabile dipendente e il tempo dedicato allo studio sarebbe la variabile predittiva.

Il termine di errore mostrerebbe la quantità di varianza nei punteggi dei test che non è stata spiegata dalla quantità di tempo di studio. Se tale varianza è uniforme o omoschedastica, ciò suggerirebbe che il modello potrebbe essere una spiegazione adeguata per le prestazioni del test, spiegandolo in termini di tempo dedicato allo studio.

Ma la varianza può essere eteroschedastica. Un grafico dei dati sui termini di errore può mostrare che una grande quantità di tempo di studio corrispondeva molto strettamente a punteggi dei test elevati, ma che i punteggi dei test di tempo di studio bassi variavano ampiamente e includevano persino punteggi molto alti.

Quindi la varianza dei punteggi non sarebbe ben spiegata semplicemente da una variabile predittiva: la quantità di tempo di studio. In questo caso, probabilmente è in funzione qualche altro fattore e potrebbe essere necessario migliorare il modello per identificarlo o loro.

Quando si considera che la varianza è la differenza misurata tra l'esito previsto e l'esito effettivo di una determinata situazione, determinare l'omoschedasticità può aiutare a determinare quali fattori devono essere corretti per l'accuratezza.

Ulteriori indagini potrebbero rivelare che alcuni studenti avevano visto le risposte al test in anticipo o che avevano precedentemente sostenuto un test simile e quindi non avevano bisogno di studiare per questo particolare test. Del resto, potrebbe semplicemente risultare che gli studenti avevano diversi livelli di capacità di superare i test indipendentemente dal loro tempo di studio e dalle loro prestazioni nei test precedenti, indipendentemente dalla materia.

Per migliorare il modello di regressione, il ricercatore dovrebbe provare altre variabili esplicative che potrebbero fornire un adattamento più accurato ai dati. Se, ad esempio, alcuni studenti avessero visto le risposte in anticipo, il modello di regressione avrebbe quindi due variabili esplicative: il tempo di studio e se lo studente avesse una precedente conoscenza delle risposte.

Con queste due variabili, si spiegherebbe maggiormente la varianza dei punteggi del test e la varianza del termine di errore potrebbe quindi essere omoschedastica, suggerendo che il modello era ben definito.

Mette in risalto

  • Se la varianza del termine di errore è omoschedastica, il modello era ben definito. Se c'è troppa varianza, il modello potrebbe non essere definito bene.

  • L'omoschedasticità si verifica quando la varianza del termine di errore in un modello di regressione è costante.

  • Al contrario, l'eteroschedasticità si verifica quando la varianza del termine di errore non è costante.

  • L'aggiunta di ulteriori variabili predittive può aiutare a spiegare le prestazioni della variabile dipendente.

FAQ

Perché l'omoschedasticità è importante?

L'omoschedasticità è importante perché identifica le differenze in una popolazione. Qualsiasi variazione in una popolazione o in un campione che non è pari produrrà risultati distorti o distorti, rendendo l'analisi errata o priva di valore.

Cosa significa eteroschedasticità?

L'eteroschedasticità nelle statistiche è la varianza dell'errore. Questa è la dipendenza dello scattering che si verifica all'interno di un campione con un minimo di una variabile indipendente. Ciò significa che la deviazione standard di una variabile prevedibile non è costante.

Come puoi sapere se una regressione è omoschedastica?

Puoi capire se una regressione è omoschedastica osservando il rapporto tra la varianza più grande e la varianza più piccola. Se il rapporto è 1,5 o inferiore, la regressione è omoschedastica.