Significato statistico
Che cos'è il significato statistico?
La significatività statistica si riferisce all'affermazione che un insieme di dati osservati non sono il risultato del caso ma possono invece essere attribuiti a una causa specifica. Il significato statistico è importante per le discipline accademiche o per i professionisti che fanno molto affidamento sull'analisi dei dati e della ricerca, come economia, finanza,. investimenti,. medicina, fisica e biologia.
La significatività statistica può essere considerata forte o debole. Quando si analizza un set di dati e si eseguono i test necessari per discernere se una o più variabili hanno un effetto su un risultato, una forte significatività statistica aiuta a supportare il fatto che i risultati sono reali e non causati dalla fortuna o dal caso. In poche parole, se un p-value è piccolo, il risultato è considerato più affidabile.
I problemi sorgono nei test di significatività statistica perché i ricercatori di solito lavorano con campioni di popolazioni più grandi e non con le popolazioni stesse. Di conseguenza, i campioni devono essere rappresentativi della popolazione, quindi i dati contenuti nel campione non devono essere in alcun modo distorti. Nella maggior parte delle scienze, inclusa l'economia, un risultato può essere considerato statisticamente significativo se ha un livello di confidenza del 95% (o talvolta del 99%).
Comprendere il significato statistico
Il calcolo della significatività statistica (test di significatività) è soggetto a un certo grado di errore. Anche se i dati sembrano avere una forte relazione, i ricercatori devono tenere conto della possibilità che si sia verificata un'apparente correlazione a causa di un caso casuale o di un errore di campionamento.
La dimensione del campione è una componente importante della significatività statistica in quanto i campioni più grandi sono meno inclini al colpo di fortuna. Solo campioni rappresentativi scelti casualmente dovrebbero essere utilizzati nel test di significatività. Il livello al quale si può accettare se un evento è statisticamente significativo è noto come livello di significatività.
I ricercatori utilizzano una misura nota come valore p per determinare la significatività statistica: se il valore p scende al di sotto del livello di significatività, il risultato è statisticamente significativo. Il valore p è una funzione delle medie e delle deviazioni standard dei campioni di dati.
Il valore p indica la probabilità con cui si è verificato il risultato statistico dato, supponendo che il solo caso sia responsabile del risultato. Se questa probabilità è piccola, il ricercatore può concludere che qualche altro fattore potrebbe essere responsabile dei dati osservati.
L'opposto del livello di significatività, calcolato come 1 meno il livello di significatività, è il livello di confidenza. Indica il grado di confidenza che il risultato statistico non è avvenuto per caso o per errore di campionamento. Il livello di confidenza abituale in molti test statistici è del 95%, portando a un livello di significatività consueto o valore p del 5%.
"P-hacking" è la pratica di confrontare in modo esaustivo molti insiemi di dati diversi alla ricerca di un risultato statisticamente significativo. Questo è soggetto a bias di segnalazione perché i ricercatori riportano solo risultati favorevoli, non negativi.
Considerazioni speciali
La significatività statistica non indica sempre una rilevanza pratica, il che significa che i risultati non possono essere applicati a situazioni aziendali reali. Inoltre, la significatività statistica può essere interpretata erroneamente quando i ricercatori non usano il linguaggio con attenzione nel riportare i loro risultati. Il fatto che un risultato sia statisticamente significativo non implica che non sia il risultato del caso, solo che è meno probabile che sia così.
Solo perché due serie di dati hanno una forte correlazione tra loro non implica una causalità. Ad esempio, il numero di film in cui recita l'attore Nicolas Cage in un dato anno è molto correlato al numero di annegamenti accidentali nelle piscine. Ma questa correlazione è spuria poiché non vi è alcuna pretesa causale teorica che possa essere fatta.
Un altro problema che può sorgere con la significatività statistica è che i dati passati e i risultati di tali dati, statisticamente significativi o meno, potrebbero non riflettere condizioni in corso o future. Negli investimenti, ciò può manifestarsi in un modello di prezzo che si rompe durante i periodi di crisi finanziaria poiché le correlazioni cambiano e le variabili non interagiscono come al solito. La significatività statistica può anche aiutare un investitore a discernere se un modello di determinazione del prezzo delle attività è migliore di un altro.
Tipi di test di significatività statistica
Diversi tipi di test di significatività vengono utilizzati a seconda della ricerca condotta. Ad esempio, i test possono essere impiegati per uno, due o più campioni di dati di varie dimensioni per medie, varianze, proporzioni, dati accoppiati o non accoppiati o distribuzioni di dati differenti.
Esistono anche diversi approcci al test di significatività, a seconda del tipo di dati disponibili. Ronald Fisher è accreditato di aver formulato uno degli approcci più flessibili, oltre a stabilire la norma di significatività a p < 0,05. Poiché la maggior parte del lavoro può essere svolto dopo che i dati sono già stati raccolti, questo metodo rimane popolare per progetti di ricerca a breve termine o ad hoc.
Cercando di basarsi sul metodo di Fisher, Jerzy Neyman ed Egon Pearson hanno finito per sviluppare un approccio alternativo. Questo metodo richiede più lavoro da fare prima che i dati vengano raccolti, ma consente ai ricercatori di progettare il loro studio in modo da controllare la probabilità di raggiungere false conclusioni.
Test di ipotesi nulle
Il significato statistico viene utilizzato nei test di ipotesi nulla in cui i ricercatori tentano di supportare le loro teorie rifiutando altre spiegazioni. Sebbene il metodo sia talvolta frainteso, rimane il metodo più popolare di test dei dati in medicina, psicologia e altri campi.
L'ipotesi nulla più comune è che il parametro in questione sia uguale a zero (indicando tipicamente che una variabile ha effetto zero sul risultato di interesse). Se i ricercatori rifiutano l'ipotesi nulla con una confidenza del 95% o migliore, possono affermare che una relazione osservata è statisticamente significativa. Le ipotesi nulle possono anche essere verificate per l'uguaglianza di effetto per due o più trattamenti alternativi.
Contrariamente al malinteso popolare, un alto livello di significatività statistica non può dimostrare che un'ipotesi sia vera o falsa. In realtà, la significatività statistica misura la probabilità che si sarebbe verificato un risultato osservato, assumendo che l'ipotesi nulla sia vera.
Il rifiuto dell'ipotesi nulla, anche se un grado molto alto di significatività statistica non può mai provare qualcosa, può solo aggiungere supporto a un'ipotesi esistente. D'altra parte, il mancato rigetto di un'ipotesi nulla è spesso motivo per respingere un'ipotesi.
Inoltre, un effetto può essere statisticamente significativo ma avere solo un impatto molto piccolo. Ad esempio, può essere statisticamente significativo che le aziende che utilizzano la carta igienica a due veli nei loro bagni abbiano dipendenti più produttivi, ma è probabile che il miglioramento della produttività assoluta di ciascun lavoratore sia minimo.
Correzione–15 maggio 2022: Questo articolo è stato modificato per evidenziare potenziali errori nei test di significatività.
Mette in risalto
La significatività statistica si riferisce all'affermazione che il risultato di dati generati da test o sperimentazioni è probabilmente attribuibile a una causa specifica.
Il calcolo della significatività statistica è soggetto a un certo grado di errore.
Un alto grado di significatività statistica indica che è improbabile che una relazione osservata sia dovuta al caso.
Vengono utilizzati diversi tipi di test di significatività a seconda della ricerca condotta.
Il significato statistico può essere interpretato erroneamente quando i ricercatori non usano il linguaggio con attenzione nel riportare i loro risultati.