Central Limit Theorem (CLT)
Vad Àr Central Limit Theorem (CLT)?
I sannolikhetsteorin sÀger central limit theorem (CLT) att fördelningen av en urvalsvariabel approximerar en normalfördelning (dvs en "klockkurva") nÀr urvalsstorleken blir större, förutsatt att alla urval Àr identiska i storlek, och oavsett av befolkningens faktiska utbredningsform.
Uttryckt pÄ ett annat sÀtt Àr CLT en statistisk utgÄngspunkt att, givet en tillrÀckligt stor urvalsstorlek frÄn en population med en Àndlig variansnivÄ, kommer medelvÀrdet av alla urvalsvariabler frÄn samma population att vara ungefÀr lika med medelvÀrdet för hela populationen. Dessutom nÀrmar dessa urval en normalfördelning,. dÀr deras varianser Àr ungefÀr lika med variansen av populationen nÀr urvalsstorleken blir större, enligt lagen om stora siffror.
Ăven om detta koncept först utvecklades av Abraham de Moivre 1733, formaliserades det inte förrĂ€n 1930, nĂ€r den noterade ungerske matematikern George PĂłlya kallade det centrala grĂ€nssatsen.
FörstÄ Central Limit Theorem (CLT)
Enligt den centrala grÀnssatsen kommer medelvÀrdet av ett urval av data att ligga nÀrmare medelvÀrdet för den totala populationen i frÄga, eftersom urvalsstorleken ökar, trots den faktiska fördelningen av data. Med andra ord Àr uppgifterna korrekta oavsett om fördelningen Àr normal eller avvikande.
Som en generell regel bedöms urvalsstorlekar pÄ cirka 30-50 vara tillrÀckliga för att CLT ska hÄlla, vilket innebÀr att fördelningen av urvalsmedlen Àr ganska normalfördelad. DÀrför, ju fler prover man tar, desto mer tar de grafiska resultaten formen av en normalfördelning. Observera dock att den centrala grÀnssatsen fortfarande kommer att approximeras i mÄnga fall för mycket mindre urvalsstorlekar, sÄsom n=8 eller n=5.
Den centrala grÀnssatsen anvÀnds ofta i samband med lagen om stora siffror, som sÀger att medelvÀrdet av urvalets medelvÀrden och standardavvikelser kommer nÀrmare att vara lika med populationsmedelvÀrde och standardavvikelse nÀr urvalsstorleken vÀxer, vilket Àr extremt anvÀndbart i exakt förutsÀga egenskaperna hos populationer.
Nyckelkomponenter i Central Limit Theorem
Den centrala grÀnssatsen bestÄr av flera nyckelegenskaper. Dessa egenskaper kretsar till stor del kring urval, urvalsstorlekar och populationen av data.
Samplingen Àr successiv. Detta innebÀr att vissa provenheter Àr gemensamma med provenheter som valts vid tidigare tillfÀllen.
Urvalet Àr slumpmÀssigt. Alla prover ska vÀljas slumpmÀssigt sÄ att de har samma statistiska möjlighet att vÀljas ut.
Sampler bör vara oberoende. Urvalen eller resultaten frÄn ett urval bör inte ha nÄgon betydelse för framtida prover eller andra provresultat.
Urval bör begrÀnsas. Det nÀmns ofta att ett urval inte bör vara mer Àn 10 % av en population om provtagningen görs utan ersÀttning. I allmÀnhet motiverar större populationsstorlekar anvÀndningen av större urvalsstorlekar.
Samplestorleken ökar. Den centrala grÀnssatsen Àr relevant eftersom fler sampel vÀljs ut.
Central Limit Theorem in Finance
CLT Àr anvÀndbart nÀr man undersöker avkastningen för en enskild aktie eller bredare index, eftersom analysen Àr enkel, pÄ grund av den relativa lÀttheten att generera nödvÀndiga finansiella data. Följaktligen förlitar sig investerare av alla slag pÄ CLT för att analysera aktieavkastning, konstruera portföljer och hantera risker.
SÀg till exempel att en investerare vill analysera den totala avkastningen för ett aktieindex som omfattar 1 000 aktier. I det hÀr scenariot kan den investeraren helt enkelt studera ett slumpmÀssigt urval av aktier för att odla berÀknad avkastning pÄ det totala indexet. För att vara sÀker bör minst 30-50 slumpmÀssigt utvalda bestÄnd inom olika sektorer provtas för att den centrala grÀnssatsen ska hÄlla. Dessutom mÄste tidigare utvalda aktier bytas ut med olika namn för att eliminera bias.
Höjdpunkter
â Central limit theorem (CLT) sĂ€ger att fördelningen av urvalsmedelvĂ€rden approximerar en normalfördelning nĂ€r urvalsstorleken blir större, oavsett populationens fördelning.
Provstorlekar lika med eller större Àn 30 anses ofta vara tillrÀckliga för att CLT ska hÄlla.
En nyckelaspekt med CLT Àr att medelvÀrdet av urvalets medelvÀrden och standardavvikelser kommer att vara lika med populationsmedelvÀrdet och standardavvikelsen.
En tillrÀckligt stor urvalsstorlek kan förutsÀga egenskaperna hos en population mer exakt.
CLT Àr anvÀndbart inom finans nÀr man analyserar en stor samling vÀrdepapper för att uppskatta portföljfördelningar och egenskaper för avkastning, risk och korrelation.
Vanliga frÄgor
Varför Àr den centrala grÀnssatsen anvÀndbar?
Den centrala grÀnssatsen Àr anvÀndbar nÀr man analyserar stora datamÀngder eftersom den tillÄter en att anta att samplingsfördelningen av medelvÀrdet kommer att vara normalfördelad i de flesta fall. Detta möjliggör enklare statistisk analys och slutledning. Till exempel kan investerare anvÀnda central limit theorem för att aggregera individuella sÀkerhetsprestandadata och generera fördelning av urvalsmedel som representerar en större populationsfördelning för vÀrdepappersavkastning över en tidsperiod.
Vad Àr formeln för Central Limit Theorem?
Den centrala grÀnssatsen har inte sin egen formel, men den bygger pÄ provmedelvÀrde och standardavvikelse. NÀr urvalsmedelvÀrden samlas in frÄn populationen anvÀnds standardavvikelse för att fördela data över en sannolikhetsfördelningskurva.
Varför Àr den centrala grÀnssatsens minimera provstorlek 30?
En urvalsstorlek pÄ 30 Àr ganska vanligt i statistiken. En urvalsstorlek pÄ 30 ökar ofta konfidensintervallet för din populationsdatauppsÀttning tillrÀckligt mycket för att motivera pÄstÄenden mot dina fynd. Ju större urvalsstorlek Àr, desto mer sannolikt kommer urvalet att vara representativt för din populationsuppsÀttning.