Investor's wiki

Central Limit Theorem (CLT)

Central Limit Theorem (CLT)

Hva er Central Limit Theorem (CLT)?

I sannsynlighetsteori sier den sentrale grensesetningen (CLT) at fordelingen av en utvalgsvariabel tilnærmer en normalfordeling (dvs. en "klokkekurve") ettersom utvalgsstørrelsen blir større, forutsatt at alle utvalgene er identiske i størrelse, og uansett av befolkningens faktiske utbredelsesform.

Sagt på en annen måte er CLT et statistisk premiss om at gitt en tilstrekkelig stor utvalgsstørrelse fra en populasjon med et begrenset variansnivå, vil gjennomsnittet av alle utvalgte variabler fra samme populasjon være omtrent lik gjennomsnittet av hele populasjonen. Videre tilnærmer disse prøvene en normalfordeling,. hvor variansene deres er omtrent lik variansen til populasjonen etter hvert som prøvestørrelsen blir større, i henhold til loven om store tall.

Selv om dette konseptet først ble utviklet av Abraham de Moivre i 1733, ble det ikke formalisert før i 1930, da den kjente ungarske matematikeren George Pólya kalte det den sentrale grensesetningen.

Forstå Central Limit Theorem (CLT)

I følge sentralgrensesetningen vil gjennomsnittet av et datautvalg være nærmere gjennomsnittet for den aktuelle populasjonen, ettersom utvalgsstørrelsen øker, til tross for den faktiske fordelingen av dataene. Med andre ord er dataene nøyaktige enten fordelingen er normal eller avvikende.

Som en generell regel anses utvalgsstørrelser på rundt 30-50 tilstrekkelig for at CLT skal holde, noe som betyr at fordelingen av utvalgsmidler er ganske normalfordelt. Derfor, jo flere prøver man tar, jo mer har de grafiske resultatene form av en normalfordeling. Merk imidlertid at den sentrale grensesetningen fortsatt vil være tilnærmet i mange tilfeller for mye mindre utvalgsstørrelser, for eksempel n=8 eller n=5.

Den sentrale grensesetningen brukes ofte sammen med loven om store tall, som sier at gjennomsnittet av utvalgsmidler og standardavvik vil komme nærmere lik populasjonsgjennomsnittet og standardavviket etter hvert som utvalgsstørrelsen vokser, noe som er ekstremt nyttig i nøyaktig forutsi egenskapene til populasjoner.

Nøkkelkomponenter i sentralgrensesetningen

Sentralgrensesetningen består av flere nøkkelegenskaper. Disse egenskapene dreier seg i stor grad om utvalg, utvalgsstørrelser og populasjonen av data.

  1. Sampling er suksessiv. Dette betyr at noen utvalgsenheter er felles med utvalgsenheter valgt ved tidligere anledninger.

  2. Utvalg er tilfeldig. Alle prøver skal velges tilfeldig slik at de har samme statistiske mulighet for å bli valgt.

  3. Utvalgene bør være uavhengige. Utvalgene eller resultatene fra en prøve skal ikke ha noen betydning for fremtidige prøver eller andre prøveresultater.

  4. Utvalgene bør begrenses. Det sies ofte at et utvalg ikke bør være mer enn 10 % av en populasjon hvis prøvetakingen utføres uten erstatning. Generelt sett garanterer større populasjonsstørrelser bruk av større utvalgsstørrelser.

  5. Samplestørrelsen øker. Den sentrale grensesetningen er relevant ettersom flere prøver er valgt.

The Central Limit Theorem in Finance

CLT er nyttig når du undersøker avkastningen til en individuell aksje eller bredere indekser, fordi analysen er enkel, på grunn av den relative enkle å generere nødvendige økonomiske data. Følgelig stoler investorer av alle typer på CLT for å analysere aksjeavkastning, konstruere porteføljer og håndtere risiko.

Si for eksempel at en investor ønsker å analysere den samlede avkastningen for en aksjeindeks som består av 1000 aksjer. I dette scenariet kan den investoren ganske enkelt studere et tilfeldig utvalg av aksjer for å dyrke estimert avkastning av totalindeksen. For å være sikker bør minst 30-50 tilfeldig utvalgte aksjer på tvers av ulike sektorer prøves for at den sentrale grensesetningen skal holde. Videre må tidligere utvalgte aksjer byttes ut med forskjellige navn for å eliminere skjevheter.

Høydepunkter

– Den sentrale grensesetningen (CLT) sier at fordelingen av utvalgsmidler tilnærmer en normalfordeling etter hvert som utvalgsstørrelsen blir større, uavhengig av populasjonens fordeling.

  • Prøvestørrelser lik eller større enn 30 anses ofte som tilstrekkelig for at CLT skal holde.

– Et sentralt aspekt ved CLT er at gjennomsnittet av utvalgets gjennomsnitt og standardavvik vil være lik populasjonsgjennomsnittet og standardavviket.

– En tilstrekkelig stor utvalgsstørrelse kan forutsi egenskapene til en populasjon mer nøyaktig.

  • CLT er nyttig innen finans når man analyserer en stor samling av verdipapirer for å estimere porteføljefordelinger og egenskaper for avkastning, risiko og korrelasjon.

FAQ

Hvorfor er sentralgrensesetningen nyttig?

Den sentrale grensesetningen er nyttig når man analyserer store datasett fordi den lar en anta at samplingsfordelingen av gjennomsnittet vil være normalfordelt i de fleste tilfeller. Dette muliggjør enklere statistisk analyse og slutninger. For eksempel kan investorer bruke sentral grensesetning for å aggregere individuelle sikkerhetsdata og generere fordeling av utvalgsmidler som representerer en større populasjonsfordeling for verdipapiravkastning over en tidsperiode.

Hva er formelen for sentralgrensesetningen?

Den sentrale grensesetningen har ikke sin egen formel, men den er avhengig av prøvegjennomsnitt og standardavvik. Ettersom utvalgsmidler samles inn fra populasjonen, brukes standardavvik for å fordele dataene over en sannsynlighetsfordelingskurve.

Hvorfor er den sentrale grensesatsens minimere prøvestørrelse 30?

En prøvestørrelse på 30 er ganske vanlig på tvers av statistikk. En prøvestørrelse på 30 øker ofte konfidensintervallet til populasjonsdatasettet ditt nok til å rettferdiggjøre påstander mot funnene dine. Jo høyere utvalgsstørrelsen din er, desto mer sannsynlig vil utvalget være representativt for populasjonssettet ditt.