Investor's wiki

sýnishorn

sýnishorn

Hvað er sýnishorn?

Sýnishorn vísar til minni, viðráðanlegrar útgáfu af stærri hópi. Það er undirmengi sem inniheldur einkenni stærri íbúa. Sýni eru notuð í tölfræðilegum prófunum þegar þýðistærðir eru of stórar til að prófið geti innihaldið alla mögulega meðlimi eða athuganir. Úrtak ætti að tákna þýðið í heild og ekki endurspegla neina hlutdrægni í garð ákveðins eiginleika.

Það eru nokkrar sýnatökuaðferðir sem vísindamenn og tölfræðingar nota, hver með sína kosti og galla.

Skilningur á sýnum

Úrtak er óhlutdrægur fjöldi athugana sem teknar eru úr þýði. Í einföldu máli er þýði heildarfjöldi athugana (þ.e. einstaklinga, dýra, hluta, gagna o.s.frv.) sem eru í tilteknum hópi eða samhengi. Úrtak, með öðrum orðum, er hluti, hluti eða brot af öllum hópnum og virkar sem hlutmengi þýðisins. Sýni eru notuð í ýmsum aðstæðum þar sem rannsóknir eru gerðar. Vísindamenn, markaðsmenn, ríkisstofnanir, hagfræðingar og rannsóknarhópar eru meðal þeirra sem nota sýni við rannsóknir sínar og mælingar.

Að nota heila íbúa til rannsókna fylgir áskorunum. Vísindamenn gætu átt í vandræðum með að fá greiðan aðgang að heilum stofnum. Og vegna eðlis sumra rannsókna geta vísindamenn átt í erfiðleikum með að fá þær niðurstöður sem þeir þurfa á réttum tíma. Þess vegna eru sýni úr fólki notuð. Notkun minni fjölda fólks sem er fulltrúi alls íbúa getur samt skilað gildum árangri á sama tíma og tíma og fjármagn minnkar.

Sýni sem vísindamenn nota verða að líkjast breiðari þýðinu til að gera nákvæmar ályktanir eða spár. Allir þátttakendur í úrtakinu ættu að deila sömu eiginleikum og eiginleikum. Þannig að ef rannsóknin snýst um karlkyns nýnema í háskóla ætti úrtakið að vera lítið hlutfall karla sem passa við þessa lýsingu. Á sama hátt, ef rannsóknarhópur framkvæmir rannsókn á svefnmynstri einstæðra kvenna yfir 50, ætti úrtakið aðeins að innihalda konur innan þessarar lýðfræði.

Sérstök atriði

Íhugaðu hóp fræðilegra vísindamanna sem vilja vita hversu margir nemendur lærðu í minna en 40 klukkustundir fyrir CFA prófið og stóðust samt. Þar sem meira en 200.000 manns taka prófið á heimsvísu á hverju ári, myndi það brenna tíma og fjármagni að ná til hvers og eins prófsþátttakanda.

Reyndar, þegar gögnum frá þýðinu hefur verið safnað og greind, hefðu nokkur ár liðið, sem gerir greininguna einskis virði þar sem nýtt þýði hefði komið fram. Það sem rannsakendur geta gert í staðinn er að taka sýni úr þýðinu og fá gögn úr þessu úrtaki.

Til að fá hlutlaust úrtak þarf valið að vera af handahófi svo allir úr þýðinu hafi jafna og líklega möguleika á að bætast í úrtakshópinn. Þetta er svipað og í lottóútdrætti og er grundvöllur einfaldrar slembiúrtaks.

Fyrir óhlutdrægt úrtak þarf valið að vera tilviljunarkennt þannig að allir í þýðinu eigi jafna möguleika á að bætast í hópinn.

Tegundir sýnatöku

Einföld slembiúrtak

Einfalt slembiúrtak er tilvalið ef hver eining í þýðinu er eins. Ef rannsakendum er ekki sama hvort viðfangsefni þeirra eru allir karlkyns eða allir konur eða sambland af báðum kynjum í einhverri mynd, getur einfalt slembiúrtak verið góð valtækni.

Segjum að það hafi verið 200.000 próftakendur sem mættu í CFA prófið árið 2021, þar af voru 40% konur og 60% karlar. Slembiúrtakið sem dregið er úr þýðinu ætti því að vera 400 konur og 600 karlar fyrir samtals 1.000 próftakendur.

En hvað með tilvik þar sem mikilvægt er að vita hlutfall karla og kvenna sem stóðust próf eftir að hafa stundað minna en 40 klukkustundir? Hér væri lagskipt slembiúrtak æskilegra en einfalt slembiúrtak.

Lagskipt slembiúrtak

Þessi tegund úrtaks, einnig nefnt hlutfallslegt slembiúrtak eða kvótaslembiúrtak, skiptir heildarþýðinu í smærri hópa. Þetta eru þekkt sem jarðlög. Fólk innan jarðlaga deilir svipuðum einkennum.

Hvað ef aldur væri mikilvægur þáttur sem vísindamenn myndu vilja hafa í gögnum sínum? Með því að nota lagskipt slembiúrtakstækni gætu þeir búið til lög eða jarðlög fyrir hvern aldurshóp. Valið úr hverju lagi yrði að vera tilviljunarkennt þannig að allir í sviginu eigi líklega möguleika á að vera með í úrtakinu. Til dæmis eru tveir þátttakendur, Alex og David, 22 ára og 24 ára, í sömu röð. Úrtaksvalið getur ekki valið eitt fram yfir annað byggt á einhverju fríðindakerfi. Þeir ættu báðir að hafa jafna möguleika á að verða valdir úr sínum aldurshópi. Jarðlögin gætu litið svona út:

TTT

Af töflunni hefur þýðinu verið skipt í aldurshópa. Til dæmis tóku 30.000 manns á aldrinum 20 til 24 ára CFA prófið árið 2021. Með því að nota þetta sama hlutfall mun úrtakshópurinn hafa (30.000 ÷ 200.000) × 1.000 = 150 próftakendur sem falla innan þessa hóps. Alex eða David – eða báðir eða hvorugir – geta verið með í hópi 150 slembiprófsþátttakenda úrtaksins.

Það eru miklu fleiri jarðlög sem hægt væri að setja saman þegar tekin er ákvörðun um úrtaksstærð. Sumir vísindamenn gætu fyllt út starfshlutverk, lönd, hjúskaparstöðu osfrv., þeirra sem taka próf þegar þeir ákveða hvernig á að búa til úrtakið.

Dæmi um sýni

Árið 2021 voru íbúar heimsins tæplega 7,9 milljarðar, þar af voru 49,6% konur og 50% karlar. Heildarfjöldi fólks í hverju landi getur líka verið íbúastærð. Hægt er að taka heildarfjölda nemenda í borg sem íbúafjölda og heildarfjöldi hunda í borg er einnig íbúastærð. Hægt er að taka sýni úr þessum þýðum í rannsóknarskyni.

Eftir CFA prófdæmið okkar gætu vísindamennirnir tekið úrtak af 1.000 CFA þátttakendum úr alls 200.000 próftakendum - þýðinu - og keyrt nauðsynleg gögn um þennan fjölda. Meðaltal þessa úrtaks yrði tekið til að áætla meðaltal þeirra sem tóku CFA próf sem stóðust þó þeir hafi aðeins lært í minna en 40 klukkustundir.

Úrtakshópurinn ætti ekki að vera hlutdrægur. Þetta þýðir að ef meðaltal 1.000 þátttakenda í CFA prófinu er 50, ætti meðaltal 200.000 þátttakenda einnig að vera um það bil 50.

##Hápunktar

  • Í tölfræði er úrtak greinandi hlutmengi stærri þýðis.

  • Í einföldu slembiúrtaki er hver eining í þýðinu eins, en lagskipt slembiúrtak skiptir heildarþýðinu í smærri hópa.

  • Notkun sýna gerir rannsakendum kleift að framkvæma rannsóknir sínar með viðráðanlegri gögnum og tímanlega.

  • Tilviljunarkennd sýni hafa ekki mikla hlutdrægni ef þau eru nógu stór, en það getur verið dýrt og tímafrekt að ná slíku úrtaki.

##Algengar spurningar

Hvað er einfalt slembisýni?

Þessi úrtaksaðferð notar svarendur eða gagnapunkta sem eru valdir af handahófi úr stærri þýðinu. Með nógu stórri úrtaksstærð fjarlægir slembiúrtak hlutdrægni.

Hvers vegna leyfa slembisýni að álykta?

Lögmál tölfræði gefa til kynna að hægt sé að gera nákvæmar mælingar og mat á þýði með því að nota úrtak. Dreifnigreining (ANOVA),. línuleg aðhvarf og fullkomnari líkanatækni eru gild vegna lögmáls stórra talna og miðmarkasetningar.

Hvers vegna nota sérfræðingar sýni í stað þess að mæla mannfjölda?

Oft er þýði of stór eða umfangsmikill til að hægt sé að mæla hvern meðlim og það væri dýrt og tímafrekt að mæla hvern meðlim. Úrtak gerir kleift að álykta um þýðið með tölfræðilegum aðferðum.

Hversu stórt sýnishorn þarftu?

Þetta fer eftir stærð íbúanna og tegund greiningar sem þú vilt gera (td hvaða öryggisbil þú ert að nota). Kraftgreining er tækni til að meta stærðfræðilega minnstu úrtaksstærð sem þarf út frá þörfum þínum. Önnur þumalputtaregla er að úrtak þitt ætti að vera nógu stórt, en ekki meira en 10% eins stórt og þýðið.