Näytteen koon huomiotta jättäminen
Mikä on näytteen koon laiminlyönti?
Näytteen koon laiminlyönti on Amos Tverskyn ja Daniel Kahnemanin tunnetusti tutkima kognitiivinen harha. Se tapahtuu, kun tilastotietojen käyttäjät tekevät vääriä johtopäätöksiä jättämällä huomioimatta kyseessä olevan tiedon otoksen kokoa. Näytteen koon laiminlyönnin taustalla on se, että ihmiset eivät usein ymmärrä, että suuria varianssitasoja esiintyy todennäköisemmin pienissä näytteissä. Siksi on ratkaisevan tärkeää määrittää, onko tietyn tilaston tuottamiseen käytetty otoskoko riittävän suuri mielekkäiden johtopäätösten tekemiseksi. Tietäminen, milloin otoskoko on riittävän suuri, voi olla haastavaa niille, jotka eivät ymmärrä hyvin tilastollisia menetelmiä.
Otoskoon laiminlyönnin ymmärtäminen
Useimmat tilastolliset päätelmät riippuvat suurten lukujen laista. Tämä tarkoittaa, että riittävän suurella otoksella otoksen ominaisuuksista voidaan päätellä tietyllä varmuudella sen perusjoukon ominaisuudet, josta otos on otettu. Kun otoskoko on liian pieni, tarkkoja ja luotettavia johtopäätöksiä ei voida tehdä. Otoskoon huomiotta jättäminen tarkoittaa pienten näytteiden vaikutuksen huomioimatta jättämistä kykyymme tehdä tällaisia johtopäätöksiä. Rahoituksen yhteydessä tämä voi johtaa sijoittajia harhaan eri tavoin.
Sijoittaja voi esimerkiksi nähdä mainoksen uudesta sijoitusrahastosta, joka kerskailee tuottaneensa 15 % vuotuista tuottoa sen perustamisesta lähtien. Sijoittaja saattaa nopeasti päätellä, että tämä rahasto on lippu nopeaan varallisuuden syntymiseen. Kuitenkin, jos rahasto ei ole ollut olemassa kovin pitkään, tämä johtopäätös saattaa antaa mahdolliselle sijoittajalle väärää tietoa. Tulokset voivat johtua lyhytaikaisista poikkeavuuksista, eikä niillä ole juurikaan tekemistä rahaston todellisen sijoitusmenetelmän kanssa.
Näytteen koon laiminlyönti sekoitetaan usein perusnopeuden laiminlyöntiin,. joka on siihen liittyvä kognitiivinen harha. Otoskoon laiminlyönnillä viitataan siihen, että otoskokojen roolia ei ole otettu huomioon tilastollisten väitteiden luotettavuuden määrittämisessä, kun taas Base Rate Neglect liittyy ihmisten taipumukseen laiminlyödä olemassa olevaa tietoa ilmiöstä arvioidessaan uutta tietoa.
Tosimaailman esimerkki näytteen koon laiminlyönnistä
Ymmärtääksesi paremmin otoskoon laiminlyöntiä, harkitse seuraavaa esimerkkiä, joka on peräisin Tverskyn ja Kahnemanin tutkimuksesta:
Henkilöä pyydetään piirtämään viiden pallon näytteestä, ja hän huomaa, että neljä on punaista ja yksi vihreä.
Henkilö poimii 20 pallon näytteestä ja huomaa, että 12 on punaisia ja kahdeksan vihreitä.
Mikä näyte antaa paremman todisteen siitä, että pallot ovat pääasiassa punaisia?
Useimmat ihmiset sanovat, että ensimmäinen, pienempi näyte tarjoaa paljon vahvemman todisteen, koska punaisen ja vihreän suhde on paljon suurempi kuin suuremmassa otoksessa. Todellisuudessa pienempi otoskoko on kuitenkin suurempi kuin suurempi suhde. 20 otos tarjoaa itse asiassa paljon vahvemman todisteen.
Toinen esimerkki Tverskyltä ja Kahnemanilta on seuraava:
Yhtä kaupunkia palvelee kaksi sairaalaa. Suuremmassa sairaalassa syntyy keskimäärin 45 vauvaa päivässä ja pienemmässä noin 15 vauvaa joka päivä. Vaikka 50 % kaikista vauvoista on poikia, tarkka prosenttiosuus vaihtelee päivästä toiseen.
Vuoden aikana jokainen sairaala kirjasi päivät, jolloin yli 60 % vauvoista sattui olemaan poikia. Mikä sairaala kirjasi enemmän tällaisia päiviä?
Kun tämä kysymys kysyttiin, 22 % vastaajista sanoi, että suurempi sairaala raportoisi enemmän tällaisia päiviä, kun taas 56 % sanoi, että tulokset olisivat samat molemmissa sairaaloissa. Itse asiassa oikea vastaus on, että pienempi sairaala kirjaisi enemmän tällaisia päiviä, koska sen pienempi koko aiheuttaisi suurempaa vaihtelua.
Kuten aiemmin totesimme, Sample Size Neglectin perusta on se, että ihmiset eivät usein ymmärrä, että suuria varianssitasoja esiintyy todennäköisemmin pienissä näytteissä. Investoinnissa tämä voi olla todella kallista.
Kohokohdat
Sample Size Neglect on Amos Tverskyn ja Daniel Kahnemanin tutkima kognitiivinen harha.
Se koostuu väärien johtopäätösten tekemisestä tilastotiedoista, koska otoskoon vaikutuksia ei ole otettu huomioon.
Niiden, jotka haluavat pienentää otoskoon laiminlyönnin riskiä, tulee muistaa, että pienemmät otoskoot liittyvät epävakaampiin tilastollisiin tuloksiin ja päinvastoin.