Investor's wiki

Teorema del limite centrale (CLT)

Teorema del limite centrale (CLT)

Qual è il teorema del limite centrale (CLT)?

Nella teoria della probabilità, il teorema del limite centrale (CLT) afferma che la distribuzione di una variabile campionaria approssima una distribuzione normale (cioè una "curva a campana") quando la dimensione del campione aumenta, assumendo che tutti i campioni siano di dimensioni identiche e indipendentemente dell'effettiva forma di distribuzione della popolazione.

In altre parole, CLT è una premessa statistica che, data una dimensione del campione sufficientemente ampia da una popolazione con un livello finito di varianza, la media di tutte le variabili campionate dalla stessa popolazione sarà approssimativamente uguale alla media dell'intera popolazione. Inoltre, questi campioni approssimano una distribuzione normale,. con le loro varianze approssimativamente uguali alla varianza della popolazione all'aumentare della dimensione del campione, secondo la legge dei grandi numeri.

Sebbene questo concetto sia stato sviluppato per la prima volta da Abraham de Moivre nel 1733, non fu formalizzato fino al 1930, quando il noto matematico ungherese George Pólya lo soprannominò il teorema del limite centrale.

Comprensione del teorema del limite centrale (CLT)

Secondo il teorema del limite centrale, la media di un campione di dati sarà più vicina alla media della popolazione complessiva in questione, all'aumentare della dimensione del campione, nonostante l'effettiva distribuzione dei dati. In altre parole, i dati sono accurati indipendentemente dal fatto che la distribuzione sia normale o aberrante.

Come regola generale, dimensioni del campione di circa 30-50 sono ritenute sufficienti per la validità del CLT, il che significa che la distribuzione delle medie campionarie è distribuita in modo abbastanza normale. Pertanto, più campioni vengono presi, più i risultati rappresentati graficamente assumono la forma di una distribuzione normale. Si noti, tuttavia, che il teorema del limite centrale sarà ancora approssimato in molti casi per campioni di dimensioni molto più piccole, come n=8 o n=5.

Il teorema del limite centrale viene spesso utilizzato insieme alla legge dei grandi numeri, che afferma che la media delle medie campionarie e delle deviazioni standard si avvicinerà all'eguagliare la media della popolazione e la deviazione standard all'aumentare della dimensione del campione, il che è estremamente utile in prevedere con precisione le caratteristiche delle popolazioni.

Componenti chiave del teorema del limite centrale

Il teorema del limite centrale comprende diverse caratteristiche chiave. Queste caratteristiche ruotano in gran parte attorno a campioni, dimensioni del campione e popolazione di dati.

  1. Il campionamento è successivo. Ciò significa che alcune unità campione sono comuni con unità campione selezionate in precedenti occasioni.

  2. Il campionamento è casuale. Tutti i campioni devono essere selezionati in modo casuale in modo che abbiano la stessa possibilità statistica di essere selezionati.

  3. I campioni dovrebbero essere indipendenti. Le selezioni oi risultati di un campione non dovrebbero avere alcun effetto sui campioni futuri o su altri risultati del campione.

  4. I campioni dovrebbero essere limitati. Si dice spesso che un campione non dovrebbe essere superiore al 10% di una popolazione se il campionamento viene eseguito senza sostituzione. In generale, dimensioni maggiori della popolazione giustificano l'uso di campioni di dimensioni maggiori.

  5. La dimensione del campione è in aumento. Il teorema del limite centrale è rilevante poiché vengono selezionati più campioni.

Il teorema del limite centrale in finanza

Il CLT è utile quando si esaminano i rendimenti di un singolo titolo o di indici più ampi, perché l'analisi è semplice, data la relativa facilità di generare i dati finanziari necessari. Di conseguenza, gli investitori di tutti i tipi si affidano al CLT per analizzare i rendimenti azionari, costruire portafogli e gestire il rischio.

Supponiamo, ad esempio, che un investitore desideri analizzare il rendimento complessivo di un indice azionario che comprende 1.000 azioni. In questo scenario, quell'investitore può semplicemente studiare un campione casuale di azioni per coltivare i rendimenti stimati dell'indice totale. Per sicurezza, almeno 30-50 titoli selezionati casualmente in vari settori dovrebbero essere campionati affinché il teorema del limite centrale sia valido. Inoltre, i titoli selezionati in precedenza devono essere scambiati con nomi diversi per eliminare le distorsioni.

Mette in risalto

  • Il teorema del limite centrale (CLT) afferma che la distribuzione della media campionaria approssima una distribuzione normale all'aumentare della dimensione del campione, indipendentemente dalla distribuzione della popolazione.

  • Dimensioni del campione uguali o superiori a 30 sono spesso considerate sufficienti per la conservazione del CLT.

  • Un aspetto chiave del CLT è che la media delle medie campionarie e delle deviazioni standard sarà uguale alla media della popolazione e alla deviazione standard.

  • Una dimensione del campione sufficientemente ampia può prevedere le caratteristiche di una popolazione in modo più accurato.

  • CLT è utile in finanza quando si analizza un'ampia raccolta di titoli per stimare le distribuzioni e le caratteristiche del portafoglio per i rendimenti, il rischio e la correlazione.

FAQ

Perché è utile il teorema del limite centrale?

Il teorema del limite centrale è utile quando si analizzano grandi insiemi di dati perché consente di presumere che la distribuzione campionaria della media sarà normalmente distribuita nella maggior parte dei casi. Ciò consente un'analisi statistica e un'inferenza più semplici. Ad esempio, gli investitori possono utilizzare il teorema del limite centrale per aggregare i dati sulla performance dei singoli titoli e generare una distribuzione di mezzi campionari che rappresentano una distribuzione più ampia della popolazione per i rendimenti dei titoli in un periodo di tempo.

Qual è la formula per il teorema del limite centrale?

Il teorema del limite centrale non ha una propria formula, ma si basa sulla media campionaria e sulla deviazione standard. Poiché le medie campionarie vengono raccolte dalla popolazione, la deviazione standard viene utilizzata per distribuire i dati su una curva di distribuzione di probabilità.

Perché il teorema del limite centrale riduce al minimo la dimensione del campione 30?

Una dimensione del campione di 30 è abbastanza comune nelle statistiche. Una dimensione del campione di 30 spesso aumenta l'intervallo di confidenza del set di dati della tua popolazione abbastanza da giustificare asserzioni contro i tuoi risultati. Maggiore è la dimensione del campione, più è probabile che il campione sia rappresentativo della tua popolazione.