Sopivuus
Mikä on istuvuus?
Termi sopivuus viittaa tilastolliseen testiin, joka määrittää, kuinka hyvin otantatiedot sopivat normaalijakauman populaation jakaumaan. Yksinkertaisesti sanottuna se olettaa, onko otos vinossa vai edustaako se tietoja, joita odotat löytäväsi todellisesta populaatiosta.
Sopivuus määrittää eron havaittujen arvojen ja mallilta odotettujen arvojen välillä normaalijakauman tapauksessa. Sopivuuden määrittämiseen on useita menetelmiä, mukaan lukien chi-neliö.
Sopivuuden ymmärtäminen
Sopivuustestit ovat tilastollisia menetelmiä, jotka tekevät päätelmiä havaituista arvoista. Voit esimerkiksi määrittää, edustaako näyteryhmä todella koko populaatiota. Sellaisenaan ne määrittävät, kuinka todelliset arvot liittyvät mallin ennustettuihin arvoihin. Päätöksenteossa käytettäessä sopivuustestejä on helpompi ennustaa tulevaisuuden trendejä ja malleja.
Kuten edellä todettiin, sopivuustestejä on useita. Niihin kuuluvat chi-neliötesti, joka on yleisin, sekä Kolmogorov-Smirnov-testi ja Shipiro-Wilk-testi. Testit suoritetaan yleensä tietokoneohjelmistolla. Mutta tilastotieteilijät voivat tehdä nämä testit käyttämällä kaavoja, jotka on räätälöity tietyntyyppiseen testiin.
Testin suorittamiseksi tarvitset tietyn muuttujan sekä oletuksen sen jakautumisesta. Tarvitset myös tietojoukon, jossa on selkeät ja selkeät arvot, kuten:
Havaitut arvot, jotka on johdettu todellisesta tietojoukosta
Odotetut arvot, jotka on otettu tehdyistä oletuksista
Sarjan luokkien kokonaismäärä
Sopivuustestejä käytetään yleisesti residuaalien normaaliuden testaamiseen tai sen määrittämiseen, onko kaksi näytettä kerätty identtisistä jakaumista.
Erityisiä huomioita
Sopivuustestin tulkitsemiseksi on tärkeää, että tilastotieteilijät määrittävät alfa-tason, kuten khin neliötestin p-arvon . P-arvo viittaa todennäköisyyteen saada tulokset lähellä havaittujen tulosten ääriarvoja. Tämä olettaa, että nollahypoteesi on oikea. Nollahypoteesi väittää, että muuttujien välillä ei ole suhdetta, ja vaihtoehtoinen hypoteesi olettaa, että suhde on olemassa.
Sen sijaan mitataan havaittujen arvojen taajuus ja sen jälkeen käytetään odotettujen arvojen ja vapausasteiden kanssa khi-neliön laskemiseen. Jos tulos on pienempi kuin alfa, nollahypoteesi on virheellinen, mikä osoittaa, että muuttujien välillä on suhde.
Sopivuustestien tyypit
Chi-neliötesti
- neliötesti,. joka tunnetaan myös riippumattomuuden khin-neliötestinä, on päättelytilastomenetelmä, joka testaa populaatiosta tehdyn väitteen pätevyyttä satunnaisotoksen perusteella.
Käytetään yksinomaan tietoihin, jotka on jaettu luokkiin (lokeroihin), ja se vaatii riittävän otoskoon tarkkojen tulosten saamiseksi. Mutta se ei osoita suhteen tyyppiä tai intensiteettiä. Se ei esimerkiksi tee johtopäätöstä, onko suhde positiivinen vai negatiivinen.
Jos haluat laskea khin-neliön sopivuuden, aseta haluamasi alfa-merkitystaso. Joten jos luottamustasosi on 95 % (tai 0,95), alfa on 0,05. Tunnista seuraavaksi testattavat kategoriset muuttujat ja määritä sitten hypoteesilausunnot niiden välisistä suhteista.
Muuttujien on suljettava toisensa pois, jotta ne kelpaavat riippumattomuuden khin-neliötestiin. Ja chi-sovitustestiä ei pitäisi käyttää jatkuvalle tiedolle.
Kolmogorov-Smirnovin testi
(F(Y i</ span>)−< span class="vlist" style="height:0.855664em;">< span class="sizing reset-size6 size3 mtight">Ni−1 ,< span style="top:-2.6550000000000002em;">Ni−F( Yi< /span>))
Venäläisten matemaatikoiden Andrei Kolmogorovin ja Nikolai Smirnovin mukaan nimetty Kolmogorov-Smirnov-testi (tunnetaan myös nimellä KS-testi) on tilastollinen menetelmä, joka määrittää, onko näyte tietystä jakaumasta populaatiossa.
Tämä testi, jota suositellaan suurille näytteille (esim. yli 2000), on ei-parametrinen. Tämä tarkoittaa, että se ei luota siihen, että mikään jakelu on kelvollinen. Tavoitteena on todistaa nollahypoteesi, joka on normaalijakauman näyte.
Kuten chi-neliö, se käyttää nolla- ja vaihtoehtoista hypoteesia ja alfa-merkittävyyden tasoa. Nolla tarkoittaa, että tiedot noudattavat tiettyä jakaumaa perusjoukon sisällä, ja vaihtoehto osoittaa, että tiedot eivät noudattaneet tiettyä jakaumaa populaatiossa. Alfaa käytetään määrittämään testissä käytetty kriittinen arvo. Mutta toisin kuin khin neliötesti, Kolmogorov-Smirnov-testi pätee jatkuviin jakaumiin.
Laskettu testitilasto merkitään usein D:llä. Se määrittää, hyväksytäänkö vai hylätäänkö nollahypoteesi. Jos D on suurempi kuin kriittinen arvo alfassa,. nollahypoteesi hylätään. Jos D on pienempi kuin kriittinen arvo, nollahypoteesi hyväksytään.
Shipiro-Wilkin testi
< span class="mord">∑i=1n< /span>(</) span>x< /span>i − xˉ) 2 (∑em; i =1n a< span class="vlist" style="height:0.3280857142857143em;">i< /span>< span>(< span class="mord mathnormal mtight">x(i ) )2,
Shipiro-Wilk-testi määrittää, noudattaako näyte normaalijakaumaa. Testi tarkistaa normaaliuden vain käytettäessä näytettä, jossa on yksi jatkuvan datan muuttuja, ja sitä suositellaan pienille otoksille aina 2000 asti.
Shipiro-Wilk-testi käyttää todennäköisyyskäyrää nimeltä QQ Plot, joka näyttää kaksi kvantiilijoukkoa y-akselilla, jotka on järjestetty pienimmästä suurimpaan. Jos jokainen kvantiili on peräisin samasta jakaumasta, kaaviosarjat ovat lineaarisia.
QQ-kaaviota käytetään varianssin arvioimiseen. Käyttämällä QQ Plot -varianssia yhdessä populaation arvioidun varianssin kanssa voidaan määrittää, kuuluuko otos normaalijakaumaan. Jos molempien varianssien osamäärä on yhtä suuri tai lähellä sitä, nollahypoteesi voidaan hyväksyä. Jos arvo on huomattavasti pienempi kuin 1, se voidaan hylätä.
Kuten yllä mainitut testit, tämäkin käyttää alfaa ja muodostaa kaksi hypoteesia: nolla ja vaihtoehto. Nollahypoteesi väittää, että otos tulee normaalijakaumasta, kun taas vaihtoehtoinen hypoteesi väittää, että otos ei tule normaalijakaumasta.
Esimerkki sopivuudesta
Tässä on hypoteettinen esimerkki, joka näyttää, kuinka sopivuustesti toimii.
Oletetaan, että pieni yhteisökuntosali toimii olettaen, että suurin kävijämäärä on maanantaisin, tiistaisin ja lauantaisin, keskimääräinen kävijämäärä keskiviikkoisin ja torstaisin ja vähiten perjantaisin ja sunnuntaisin. Näiden oletusten perusteella kuntosali työllistää päivittäin tietyn määrän henkilökuntaa jäsenten sisäänkirjaamiseen, tilojen siivoamiseen, koulutuspalvelujen tarjoamiseen ja tuntien pitämiseen.
Mutta kuntosali ei toimi hyvin taloudellisesti, ja omistaja haluaa tietää, pitävätkö nämä osallistumisoletukset ja henkilöstömäärät oikein. Omistaja päättää laskea kuntosalilla kävijöiden määrän joka päivä kuuden viikon ajan. He voivat sitten verrata kuntosalin oletettua osallistumista sen havaittuun osallistumiseen käyttämällä esimerkiksi khin neliön sopivuustestiä.
Nyt kun heillä on uudet tiedot, he voivat päättää, miten kuntosalia voidaan parhaiten hallita ja parantaa kannattavuutta.
Bottom Line
Sopivuustestit määrittävät, kuinka hyvin otostiedot sopivat siihen, mitä populaatiolta odotetaan. Otostiedoista kerätään havaittu arvo ja sitä verrataan laskettuun odotusarvoon poikkeamamittauksella. Saatavilla on erilaisia sopivuushypoteesitestejä riippuen siitä, mitä tulosta haet.
Oikean sopivuustestin valinta riippuu suurelta osin siitä, mitä haluat tietää näytteestä ja kuinka suuri näyte on. Jos esimerkiksi haluat tietää, vastaavatko kategoristen tietojen havaitut arvot kategoristen tietojen odotettuja arvoja, käytä khinneliötä. Jos haluat tietää, seuraako pieni näyte normaalijakaumaa, Shipiro-Wilk-testi saattaa olla edullinen. Käytettävissä on monia testejä sopivuuden määrittämiseksi.
Kohokohdat
Sopivuus on tilastollinen testi, joka yrittää määrittää, vastaako havaittujen arvojen joukko sovellettavan mallin mukaisia odotuksia.
Ne voivat näyttää sinulle, sopivatko näytetietosi odotettuun tietojoukkoon normaalijakaumasta populaatiosta.
Khin-neliötesti määrittää, onko kategoristen tietojen välillä suhdetta.
Sopivuustestejä on monenlaisia, mutta yleisin on khin neliötesti.
Kolmogorov-Smirnov-testi määrittää, tuleeko näyte tietystä populaatiojakaumasta.
UKK
Mikä on sopivuus Chi-neliötestissä?
Khin-neliö testaa, onko kategoristen muuttujien välillä suhteita ja edustaako otos kokonaisuutta. Se arvioi, kuinka tarkasti havaitut tiedot heijastavat odotettua dataa tai kuinka hyvin ne sopivat yhteen.
Mitä sopivuus tarkoittaa?
Goodness-of-Fit on tilastollinen hypoteesitesti, jota käytetään sen selvittämiseen, kuinka tarkasti tarkkailtu data heijastaa odotettua dataa. Sopivuustestit voivat auttaa määrittämään, noudattaako näyte normaalijakaumaa, liittyvätkö kategoriset muuttujat toisiinsa vai ovatko satunnaisotokset samasta jakaumasta.
Kuinka teet sopivuustestin?
Sopivuustesti koostuu erilaisista testausmenetelmistä. Testin tavoite auttaa määrittämään, mitä menetelmää käytetään. Jos tavoitteena on esimerkiksi testata normaalia suhteellisen pienellä näytteellä, Shipiro-Wilk-testi voi olla sopiva. Jos halutaan määrittää, tuliko näyte tietystä jakaumasta populaatiossa, käytetään Kolmogorov-Smirnovin testiä. Jokainen testi käyttää omaa ainutlaatuista kaavaansa. Niillä on kuitenkin yhteisiä piirteitä, kuten nollahypoteesi ja merkitystaso.
Miksi istuvuus on tärkeää?
Sopivuustestit auttavat määrittämään, vastaavatko havaitut tiedot odotettuja tietoja. Päätöksiä voidaan tehdä hypoteesitestin tulosten perusteella. Esimerkiksi jälleenmyyjä haluaa tietää, mikä tuotevalikoima houkuttelee nuoria. Jälleenmyyjä tutkii satunnaisen otoksen vanhoista ja nuorista tunnistaakseen, mikä tuote on suosituin. Chi-neliön avulla he havaitsevat, että tuotteen A ja nuorten välillä on suhde 95 prosentin varmuudella. Näiden tulosten perusteella voitiin päätellä, että tämä otos edustaa nuorten aikuisten populaatiota. Vähittäiskaupan markkinoijat voivat käyttää tätä kampanjoidensa uudistamiseen.