Investor's wiki

Analisi della varianza (ANOVA)

Analisi della varianza (ANOVA)

Che cos'è l'analisi della varianza (ANOVA)?

L'analisi della varianza (ANOVA) è uno strumento di analisi utilizzato nelle statistiche che divide una variabilità aggregata osservata trovata all'interno di un set di dati in due parti: fattori sistematici e fattori casuali. I fattori sistematici hanno un'influenza statistica sul dato set di dati, mentre i fattori casuali no. Gli analisti utilizzano il test ANOVA per determinare l'influenza che le variabili indipendenti hanno sulla variabile dipendente in uno studio di regressione.

metodi di test t e z sviluppati nel XX secolo sono stati utilizzati per l'analisi statistica fino al 1918, quando Ronald Fisher ha creato il metodo di analisi della varianza. L'ANOVA è anche chiamata analisi della varianza di Fisher ed è l'estensione dei test t e z. Il termine divenne famoso nel 1925, dopo essere apparso nel libro di Fisher, "Metodi statistici per i ricercatori". È stato impiegato nella psicologia sperimentale e successivamente ampliato a materie più complesse.

La formula per ANOVA è:

F=MST MSE dove:</ mtext></ mtd>F=Coefficiente ANOVA< /mtext>< /mtd>MST=Somma media dei quadrati dovuta al trattamentoMSE=Somma media di quadrati a causa di un errore\begin &\text = \frac{ \text }{ \text } \ &\textbf \ &\text = \text \ &\text = \text \ &\text = \text{Somma media dei quadrati dovuta all'errore} \ \end

Cosa rivela l'analisi della varianza?

Il test ANOVA è il passaggio iniziale nell'analisi dei fattori che influenzano un determinato set di dati. Una volta terminato il test, un analista esegue ulteriori test sui fattori metodici che contribuiscono in modo misurabile all'incoerenza del set di dati. L'analista utilizza i risultati del test ANOVA in un test f per generare dati aggiuntivi che si allineano con i modelli di regressione proposti.

Il test ANOVA consente di confrontare più di due gruppi contemporaneamente per determinare se esiste una relazione tra di loro. Il risultato della formula ANOVA, la statistica F (detta anche F-ratio), consente l'analisi di più gruppi di dati per determinare la variabilità tra i campioni e all'interno dei campioni.

Se non esiste alcuna differenza reale tra i gruppi testati, che è chiamata ipotesi nulla,. il risultato della statistica del rapporto F dell'ANOVA sarà vicino a 1. La distribuzione di tutti i possibili valori della statistica F è la distribuzione F. Questo è in realtà un gruppo di funzioni di distribuzione, con due numeri caratteristici, chiamati gradi di libertà al numeratore e gradi di libertà al denominatore.

Esempio di come utilizzare ANOVA

Un ricercatore potrebbe, ad esempio, testare gli studenti di più college per vedere se gli studenti di uno dei college superano costantemente gli studenti degli altri college. In un'applicazione aziendale, un ricercatore di ricerca e sviluppo potrebbe testare due diversi processi di creazione di un prodotto per vedere se un processo è migliore dell'altro in termini di efficienza dei costi.

Il tipo di test ANOVA utilizzato dipende da una serie di fattori. Viene applicato quando i dati devono essere sperimentali. L'analisi della varianza viene utilizzata se non c'è accesso al software statistico che determina il calcolo manuale dell'ANOVA. È semplice da usare e più adatto per piccoli campioni. Con molti progetti sperimentali, le dimensioni del campione devono essere le stesse per le varie combinazioni a livello di fattore.

ANOVA è utile per testare tre o più variabili. È simile a più t-test a due campioni. Tuttavia, si traduce in un minor numero di errori di tipo I ed è appropriato per una serie di problemi. ANOVA raggruppa le differenze confrontando le medie di ciascun gruppo e include la distribuzione della varianza in diverse fonti. È impiegato con soggetti, gruppi di prova, tra gruppi e all'interno di gruppi.

ANOVA a una via contro ANOVA a due vie

Esistono due tipi principali di ANOVA: unidirezionale (o unidirezionale) e bidirezionale. Ci sono anche variazioni di ANOVA. Ad esempio, MANOVA (ANOVA multivariata) differisce da ANOVA poiché il primo verifica simultaneamente più variabili dipendenti mentre il secondo valuta solo una variabile dipendente alla volta. Unidirezionale o bidirezionale si riferisce al numero di variabili indipendenti nel test di analisi della varianza. Un'ANOVA unidirezionale valuta l'impatto di un unico fattore su una sola variabile di risposta. Determina se tutti i campioni sono uguali. L'ANOVA unidirezionale viene utilizzata per determinare se esistono differenze statisticamente significative tra le medie di tre o più gruppi indipendenti (non correlati).

Un'ANOVA a due vie è un'estensione dell'ANOVA unidirezionale. Con un unidirezionale, hai una variabile indipendente che influisce su una variabile dipendente. Con un ANOVA a due vie, ci sono due indipendenti. Ad esempio, un'ANOVA a due vie consente a un'azienda di confrontare la produttività dei lavoratori in base a due variabili indipendenti, come la retribuzione e il set di competenze. Viene utilizzato per osservare l'interazione tra i due fattori e testare l'effetto di due fattori contemporaneamente.

Mette in risalto

  • Se non esiste una vera varianza tra i gruppi, il rapporto F dell'ANOVA dovrebbe essere vicino a 1.

  • Un'ANOVA unidirezionale viene utilizzata per tre o più gruppi di dati, per ottenere informazioni sulla relazione tra le variabili dipendenti e indipendenti.

  • L'analisi della varianza, o ANOVA, è un metodo statistico che separa i dati della varianza osservata in diverse componenti da utilizzare per test aggiuntivi.