Statistiche non parametriche
Cosa sono le statistiche non parametriche?
La statistica non parametrica si riferisce a un metodo statistico in cui si presume che i dati non provengano da modelli prescritti che sono determinati da un numero limitato di parametri; esempi di tali modelli includono il modello di distribuzione normale e il modello di regressione lineare. Le statistiche non parametriche a volte utilizzano dati ordinali, il che significa che non si basano su numeri, ma piuttosto su una classifica o un ordine di sorta. Ad esempio, un sondaggio che trasmette le preferenze dei consumatori che vanno da Mi piace a Non mi piace sarebbe considerato un dato ordinale.
Le statistiche non parametriche includono statistiche descrittive non parametriche,. modelli statistici, inferenza e test statistici. La struttura del modello dei modelli non parametrici non è specificata a priori ma è invece determinata dai dati. Il termine non parametrico non intende implicare che tali modelli siano completamente privi di parametri, ma piuttosto che il numero e la natura dei parametri sono flessibili e non fissati in anticipo. Un istogramma è un esempio di stima non parametrica di una distribuzione di probabilità.
Comprendere le statistiche non parametriche
Nelle statistiche, le statistiche parametriche includono parametri come la media, la deviazione standard, la correlazione di Pearson, la varianza, ecc. Questa forma di statistica utilizza i dati osservati per stimare i parametri della distribuzione. Nella statistica parametrica, si presume spesso che i dati provengano da una distribuzione normale con parametri sconosciuti μ (media della popolazione) e σ2 (varianza della popolazione), che vengono quindi stimati utilizzando la media campionaria e la varianza campionaria.
Le statistiche non parametriche non presuppongono la dimensione del campione o se i dati osservati siano quantitativi.
Le statistiche non parametriche non presuppongono che i dati vengano estratti da una distribuzione normale. Invece, la forma della distribuzione viene stimata in questa forma di misurazione statistica. Mentre ci sono molte situazioni in cui si può presumere una distribuzione normale, ci sono anche alcuni scenari in cui il vero processo di generazione dei dati è tutt'altro che normalmente distribuito.
Esempi di statistiche non parametriche
Nel primo esempio, si consideri un analista finanziario che desidera stimare il valore a rischio (VaR) di un investimento. L'analista raccoglie i dati sugli utili da centinaia di investimenti simili su un orizzonte temporale simile. Invece di presumere che i guadagni seguano una distribuzione normale, usano l'istogramma per stimare la distribuzione in modo non parametrico. Il 5° percentile di questo istogramma fornisce quindi all'analista una stima non parametrica del VaR.
Per un secondo esempio, si consideri un altro ricercatore che vuole sapere se le ore medie di sonno sono legate alla frequenza con cui ci si ammala. Poiché molte persone si ammalano raramente, se non del tutto, e occasionalmente altre si ammalano molto più spesso della maggior parte delle altre, la distribuzione della frequenza della malattia è chiaramente non normale, essendo distorta a destra e incline a valori anomali. Pertanto, anziché utilizzare un metodo che presuppone una distribuzione normale per la frequenza della malattia, come avviene ad esempio nell'analisi di regressione classica, il ricercatore decide di utilizzare un metodo non parametrico come l'analisi di regressione quantile.
Considerazioni speciali
Le statistiche non parametriche hanno guadagnato apprezzamento grazie alla loro facilità d'uso. Man mano che la necessità di parametri viene ridotta, i dati diventano più applicabili a una più ampia varietà di test. Questo tipo di statistiche può essere utilizzato senza la media, la dimensione del campione, la deviazione standard o la stima di altri parametri correlati quando nessuna di queste informazioni è disponibile.
Poiché la statistica non parametrica fa meno ipotesi sui dati del campione, la sua applicazione ha un ambito più ampio rispetto alla statistica parametrica. Nei casi in cui il test parametrico è più appropriato, i metodi non parametrici saranno meno efficienti. Questo perché le statistiche non parametriche eliminano alcune informazioni disponibili nei dati, a differenza delle statistiche parametriche.
Mette in risalto
Questo tipo di analisi è spesso più adatto quando si considera l'ordine di qualcosa, dove anche se i dati numerici cambiano, i risultati probabilmente rimarranno gli stessi.
Le statistiche non parametriche sono facili da usare ma non offrono la precisione millimetrica di altri modelli statistici.