Investor's wiki

Central Limit Theorem (CLT)

Central Limit Theorem (CLT)

Hvað er miðmarkssetningin (CLT)?

Í líkindafræði segir miðtakmarkasetningin (CLT) að dreifing úrtaksbreytu nálgist normaldreifingu (þ.e. „bjöllukúrfa“) eftir því sem úrtaksstærðin verður stærri, að því gefnu að öll úrtak séu eins að stærð, og óháð af raunverulegu dreifingarformi íbúanna.

Með öðrum hætti, CLT er tölfræðileg forsenda þess að miðað við nægilega stóra úrtaksstærð úr þýði með endanlegt dreifnistig mun meðaltal allra úrtaksbreyta úr sama þýði vera um það bil jafnt meðaltali alls þýðisins. Ennfremur nálgast þessi úrtök normaldreifingu,. þar sem dreifni þeirra er um það bil jöfn dreifni þýðisins eftir því sem úrtakið verður stærra, samkvæmt lögmáli stórra talna.

Þrátt fyrir að þetta hugtak hafi fyrst verið þróað af Abraham de Moivre árið 1733, var það ekki formlegt fyrr en 1930, þegar ungverski stærðfræðingurinn George Pólya kallaði hana miðmarkasetninguna.

Skilningur á Central Limit Theorem (CLT)

Samkvæmt miðmarkasetningunni verður meðaltal úrtaks gagna nær meðaltali viðkomandi heildarþýðis, eftir því sem úrtakið eykst, þrátt fyrir raunverulega dreifingu gagnanna. Með öðrum orðum, gögnin eru nákvæm hvort sem dreifingin er eðlileg eða afbrigðileg.

Að jafnaði er úrtaksstærð um 30-50 taldar nægjanlegar til að CLT haldi, sem þýðir að dreifing úrtaks meðaltala er nokkuð eðlilega dreifð. Því fleiri sýni sem tekin eru, því meira sem línurit taka á sig mynd af normaldreifingu. Athugaðu hins vegar að miðmarkasetningin verður samt nálguð í mörgum tilfellum fyrir mun minni úrtaksstærðir, eins og n=8 eða n=5.

Miðtakmarkasetningin er oft notuð samhliða lögmáli stórra talna sem segir að meðaltal meðaltala úrtaks og staðalfrávika komi nær því að jafnast á við meðaltal þýðis og staðalfrávik eftir því sem úrtakið stækkar, sem er afar gagnlegt í spá nákvæmlega fyrir um eiginleika íbúa.

Lykilþættir miðmarkasetningarinnar

Miðtakmarkasetningin samanstendur af nokkrum lykileinkennum. Þessir eiginleikar snúast að miklu leyti um úrtök, úrtaksstærðir og þýði gagna.

  1. Urtak er í röð. Þetta þýðir að sumar úrtakseiningar eru algengar með úrtakseiningum sem voru valdar við fyrri tækifæri.

  2. Urtak er tilviljunarkennt. Öll úrtök verða að vera valin af handahófi svo þau hafi sömu tölfræðilega möguleika á að vera valin.

  3. Sýni ættu að vera óháð. Val eða niðurstöður úr einu úrtaki ættu ekki að hafa nein áhrif á framtíðarsýni eða aðrar úrtaksniðurstöður.

  4. Takmarka ætti sýni. Það er oft nefnt að úrtak ætti ekki að vera meira en 10% af þýði ef sýnataka er gerð án þess að skipta út. Almennt séð gefur stærri þýðisstærð tilefni til að nota stærri úrtak.

  5. Stærð sýnis eykst. Miðmarkasetningin skiptir máli þar sem fleiri sýni eru valin.

Miðmarkasetningin í fjármálum

CLT er gagnlegt þegar kannað er ávöxtun einstakra hlutabréfa eða breiðari vísitölu, vegna þess að greiningin er einföld, vegna þess hve auðvelt er að búa til nauðsynleg fjárhagsgögn. Þar af leiðandi treysta fjárfestar af öllum gerðum á CLT til að greina ávöxtun hlutabréfa, búa til eignasöfn og stjórna áhættu.

Segjum til dæmis að fjárfestir vilji greina heildarávöxtun hlutabréfavísitölu sem samanstendur af 1.000 hlutabréfum. Í þessari atburðarás gæti þessi fjárfestir einfaldlega rannsakað slembiúrtak hlutabréfa til að rækta áætlaða ávöxtun heildarvísitölunnar. Til að vera öruggur ætti að taka sýni úr að minnsta kosti 30-50 af handahófi völdum stofnum í ýmsum geirum til að miðmarkasetningin haldi. Ennfremur verður að skipta út áður völdum hlutabréfum með mismunandi nöfnum til að koma í veg fyrir hlutdrægni.

Hápunktar

  • Miðtakmarkasetningin (CLT) segir að dreifing úrtaksmeðtala nálgist normaldreifingu eftir því sem úrtaksstærðin verður stærri, óháð dreifingu þýðisins.

  • Sýnisstærðir sem eru jafnar eða stærri en 30 eru oft taldar nægjanlegar til að CLT haldi.

  • Lykilatriði í CLT er að meðaltal meðaltals úrtaks og staðalfrávika mun jafnast á við meðaltal þýðis og staðalfrávik.

  • Nægilega stór úrtak getur sagt fyrir um eiginleika þýðis með nákvæmari hætti.

  • CLT er gagnlegt í fjármálum þegar verið er að greina mikið safn verðbréfa til að meta dreifingu eignasafns og eiginleika fyrir ávöxtun, áhættu og fylgni.

Algengar spurningar

Hvers vegna er miðmarkasetningin gagnleg?

Miðtakmarkasetningin er gagnleg þegar stór gagnasöfn eru greind vegna þess að hún gerir ráð fyrir að sýnatökudreifing meðaltalsins verði normaldreifð í flestum tilfellum. Þetta gerir auðveldari tölfræðilega greiningu og ályktanir. Til dæmis geta fjárfestar notað miðlæga takmörkunarsetningu til að safna saman einstökum öryggisgögnum og búa til dreifingu sýnishorna sem tákna stærri íbúadreifingu fyrir ávöxtun öryggis yfir ákveðið tímabil.

Hver er formúlan fyrir miðmarkasetningu?

Miðtakmarkasetningin hefur ekki sína eigin formúlu, en hún byggir á meðaltali úrtaks og staðalfráviks. Þar sem meðaltöl úrtaks eru tekin úr þýðinu er staðalfrávik notað til að dreifa gögnunum yfir líkindadreifingarferil.

Hvers vegna er miðlæg takmörkunarsetning 30?

Úrtaksstærð 30 er nokkuð algeng í tölfræði. Úrtaksstærð 30 eykur oft öryggisbil íbúagagnasetts þíns nógu mikið til að réttlæta fullyrðingar gegn niðurstöðum þínum. Því hærra sem úrtakið þitt er, því líklegra er að úrtakið sé dæmigert fyrir þýðishópinn þinn.