Näytteiden jakelu
Mikä on otantajakauma?
Otantajakauma on tilaston todennäköisyysjakauma,. joka saadaan suuremmasta määrästä näytteitä tietystä perusjoukosta. Tietyn populaation otantajakauma on useiden erilaisten tulosten frekvenssien jakauma, joka voi mahdollisesti esiintyä populaation tilastolle.
Tilastoissa populaatio on koko pooli, josta tilastollinen otos otetaan. Populaatio voi tarkoittaa kokonaista ryhmää ihmisiä, esineitä, tapahtumia, sairaalakäyntejä tai mittauksia. Populaatio voidaan siis sanoa olevan kokonaishavainto kohteista, jotka on ryhmitelty yhteen yhteisen piirteen mukaan.
- Otosjakauma on tilasto, joka saadaan toistuvalla otannalla suuremmasta populaatiosta.
- Se kuvaa useita mahdollisia tuloksia kuin tilastolla, kuten jonkin muuttujan keskiarvo tai muoto, koska se todella on olemassa populaatio.
- Suurin osa tutkijoiden analysoimista tiedoista on itse asiassa otettu näytteistä, ei populaatioista.
Otantajakelun ymmärtäminen
Suuri osa akateemikkojen, tilastotieteilijöiden, tutkijoiden, markkinoijien, analyytikoiden jne. laatimista ja käyttämistä tiedoista on itse asiassa näytteitä, ei populaatioita. Otos on populaation osajoukko. Esimerkiksi lääketieteellinen tutkija, joka halusi verrata kaikkien Pohjois-Amerikassa vuosina 1995–2005 syntyneiden vauvojen keskipainoa Etelä-Amerikassa saman ajanjakson aikana syntyneiden vauvojen keskipainoon, ei voi kohtuullisessa ajassa saada tietoja koko väestöstä. yli miljoona synnytystä, jotka tapahtuivat kymmenen vuoden aikana. Sen sijaan he käyttävät vain esimerkiksi 100 vauvan painoa kullakin mantereella tehdäkseen johtopäätöksen. Käytetty 200 vauvan paino on näyte ja laskettu keskimääräinen paino on otoksen keskiarvo.
Oletetaan nyt, että sen sijaan, että hän ottaisi vain yhden näytteen 100 vastasyntyneen painosta jokaiselta mantereelta, lääketieteellinen tutkija ottaa toistuvia satunnaisia näytteitä yleisestä populaatiosta ja laskee otoskeskiarvon jokaiselle näyteryhmälle. Joten Pohjois-Amerikasta he keräävät tiedot 100 vastasyntyneen painosta Yhdysvalloissa, Kanadassa ja Meksikossa seuraavasti: neljä 100 näytettä valituista sairaaloista Yhdysvalloissa, viisi 70 näytettä Kanadasta ja kolme 150 tietuetta Meksikosta. 1200 painoista vastasyntynyttä vauvoja ryhmiteltynä 12 sarjaan. He keräävät myös näytetietoja 100 syntymäpainosta jokaisesta Etelä-Amerikan 12 maasta.
Jokaisella näytteellä on oma näytekeskiarvonsa ja näytekeskiarvojen jakauma tunnetaan otosjakaumana.
Kullekin näytejoukolle laskettu keskimääräinen paino on keskiarvon otantajakauma. Otuksesta ei voida laskea vain keskiarvoa. Otostiedoista voidaan laskea muita tilastoja,. kuten keskihajonnat, varianssit, suhteet ja vaihteluvälit. Keskihajonnalla ja varianssilla mitataan otosjakauman vaihtelua.
Havaintojen määrä perusjoukossa, havaintojen määrä otoksessa ja menetelmä otosjoukkojen muodostamisessa määräävät otosjakauman vaihtelevuuden. Näytteenottojakauman keskihajontaa kutsutaan keskivirheeksi. Otosjakauman keskiarvo on yhtä suuri kuin perusjoukon keskiarvo, mutta keskivirhe riippuu perusjoukon keskihajonnasta, perusjoukon koosta ja otoksen koosta.
Kun tiedetään, kuinka hajallaan kunkin otosjoukon keskiarvot ovat toisistaan ja perusjoukon keskiarvosta, saadaan osoitus siitä, kuinka lähellä otoskeskiarvo on perusjoukon keskiarvoa. Otosjakauman standardivirhe pienenee otoskoon kasvaessa.
Erityisiä huomioita
Populaatiolla tai yhdellä lukujoukolla on normaalijakauma. Koska otantajakauma kuitenkin sisältää useita havaintosarjoja, sillä ei välttämättä ole kellokaarevaa muotoa.
Esimerkkimme mukaan vauvojen väestön keskimääräinen paino Pohjois-Amerikassa ja Etelä-Amerikassa on normaalijakauma, koska jotkut vauvat ovat alipainoisia (keskiarvon alapuolella) tai ylipainoisia (keskiarvon yläpuolella), ja useimmat vauvat jäävät näiden väliin (keskiarvon tienoilla). ). Jos vastasyntyneiden keskimääräinen paino Pohjois-Amerikassa on seitsemän puntaa, myös näytteen keskipaino jokaisessa 12:sta Pohjois-Amerikasta tallennetusta näytehavaintosarjasta on lähellä seitsemää kiloa.
Jos kuitenkin piirrät kunkin 1 200 näyteryhmän kunkin lasketun keskiarvon, tuloksena oleva muoto voi johtaa tasaiseen jakautumiseen, mutta on vaikea ennustaa varmuudella, mikä todellinen muoto tulee olemaan. Mitä enemmän näytteitä tutkija käyttää yli miljoonan painoluvun populaatiosta, sitä enemmän kuvaaja alkaa muodostaa normaalijakaumaa.