Kvartiili
Mikä on kvartiili?
Kvartiili on tilastollinen termi, joka kuvaa havaintojen jakamista neljään määriteltyyn aikaväliin perustuen datan arvoihin ja siihen, miten niitä verrataan koko havaintojen joukkoon.
Neljännesten ymmärtäminen
Kvartiilin ymmärtämiseksi on tärkeää ymmärtää mediaani keskeisen suuntauksen mittana. Mediaani tilastoissa on lukujoukon keskiarvo. Se on piste, jossa tarkalleen puolet tiedoista on keskiarvon ala- ja yläpuolella.
Joten jos 13 numeron joukko on lajiteltu (nouseva tai laskeva), mediaani olisi seitsemäs numero. Tätä arvoa edeltävät kuusi numeroa ovat pienimmät luvut tiedoissa ja kuusi mediaanin jälkeistä numeroa ovat suurimmat luvut annetussa tietojoukossa. Koska jakauman ääriarvot tai poikkeamat eivät vaikuta mediaaniin, se on joskus parempi kuin keskiarvo.
Mediaani on luotettava sijainnin estimaattori, mutta se ei kerro mitään siitä, kuinka sen arvon kummallakin puolella oleva data leviää tai hajaantuu. Siinä kvartiili astuu sisään. Kvartiili mittaa keskiarvon ylä- ja alapuolella olevien arvojen leviämistä jakamalla jakauman neljään ryhmään.
Kuinka neljännekset toimivat
Aivan kuten mediaani jakaa tiedot puoliksi siten, että 50% mittauksesta on mediaanin alapuolella ja 50% on sen yläpuolella, kvartiili jakaa tiedot neljänneksiin siten, että 25% mittauksista on pienempiä kuin alempi kvartiili, 50 % ovat pienempiä kuin mediaani ja 75 % ovat pienempiä kuin ylempi kvartiili.
Kvartiili jakaa tiedot kolmeen pisteeseen – alempaan kvartiiliin, mediaaniin ja ylempään kvartiiliin – muodostaen tietojoukon neljä ryhmää. Alempi kvartiili tai ensimmäinen kvartiili on merkitty Q1:ksi, ja se on keskimmäinen luku, joka on tietojoukon pienimmän arvon ja mediaanin välissä. Toinen kvartiili, Q2, on myös mediaani. Ylempi tai kolmas kvartiili, jota merkitään Q3:lla, on keskipiste, joka sijaitsee jakauman mediaanin ja suurimman luvun välillä.
Nyt voimme kartoittaa neljä kvartiileista muodostettua ryhmää. Ensimmäinen arvoryhmä sisältää pienimmän luvun Q1:een asti; toiseen ryhmään kuuluu Q1 mediaaniin; kolmas joukko on Q3:n mediaani; neljäs luokka käsittää Q3:n koko joukon korkeimpaan datapisteeseen.
Jokainen kvartiili sisältää 25 % kaikista havainnoista. Yleensä tiedot on järjestetty pienimmästä suurimpaan:
Ensimmäinen kvartiili: pienin 25 % luvuista
Toinen kvartiili: 0–50 % (mediaaniin asti)
Kolmas kvartiili: 0–75 %
Neljäs kvartiili: korkein 25 % luvuista
Esimerkki kvartiilista
Oletetaan, että matematiikan tulosten jakautuminen 19 oppilaan luokassa nousevassa järjestyksessä on:
- 59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Merkitse ensin mediaani Q2, joka tässä tapauksessa on 10th-arvo: 75.
Q1 on keskipiste pienimmän pistemäärän ja mediaanin välillä. Tässä tapauksessa Q1 on ensimmäisen ja viidennen pistemäärän välissä: 68. (Huomaa, että mediaani voidaan ottaa mukaan myös laskettaessa Q1 tai Q3 parittomille arvoille. Jos sisällyttäisimme mediaanin keskipisteen kummallakin puolella , niin Q1 on keskiarvo ensimmäisen ja 10^:nnen pisteen välillä, joka on viidennen ja kuudennen pisteen keskiarvo — (viides + kuudes)/2 = (68 + 69)/2 = 68,5).
Q3 on keskiarvo Q2:n ja korkeimman pistemäärän välillä: 84. (Tai jos otat mukaan mediaanin, Q3 = (82 + 84)/2 = 83).
Nyt kun meillä on kvartiilimme, tulkitaan niiden numerot. Pistemäärä 68 (Q1) edustaa ensimmäistä kvartiilia ja on 25th prosenttipiste. 68 on mediaani saatavilla olevissa tiedoissa asetetun pistemäärän alemmasta puoliskosta eli tulosten mediaanista 59:stä 75:een.
Q1 kertoo meille, että 25 % pisteistä on alle 68 ja 75 % luokkapisteistä suurempia. Q2 (mediaani) on 50th prosenttipiste ja osoittaa, että 50 % pisteistä on alle 75 ja 50 % pisteistä on yli 75. Lopuksi Q3, 75th prosenttipiste, paljastaa, että 25 %. pisteistä on suurempia ja 75 % pienempiä kuin 84.
Erityisiä huomioita
Jos Q1:n datapiste on kauempana mediaanista kuin Q3 on mediaanista, voidaan sanoa, että aineiston pienempien arvojen välillä on suurempi hajonta kuin suurempien arvojen välillä. Sama logiikka pätee, jos Q3 on kauempana Q2:sta kuin Q1 mediaanista.
Vaihtoehtoisesti, jos datapisteitä on parillinen määrä, mediaani on kahden keskimmäisen luvun keskiarvo. Yllä olevassa esimerkissämme, jos meillä oli 20 opiskelijaa 19 sijasta, heidän tulosten mediaani on 10^:nnen^ ja 11th-luvun aritmeettinen keskiarvo .
Kvartiileja käytetään kvartiilien välisen alueen laskemiseen, joka on mediaanin vaihtelun mitta. Interkvartiiliväli lasketaan yksinkertaisesti ensimmäisen ja kolmannen kvartiilin erotuksena: Q3–Q1. Käytännössä datan keskimmäisen puoliskon alue osoittaa, kuinka hajaantuneita tiedot ovat.
Suurille tietojoukoille Microsoft Excelissä on QUARTILE-funktio kvartiilien laskemiseksi.
Kohokohdat
Kvartiili jakaa tiedot kolmeen pisteeseen – alempaan kvartiiliin, mediaaniin ja ylempään kvartiiliin – muodostaen tietojoukon neljä ryhmää.
Kvartiili mittaa keskiarvon ylä- ja alapuolella olevien arvojen leviämistä jakamalla jakauman neljään ryhmään.
Kvartiileja käytetään kvartiilien välisen alueen laskemiseen, joka on mediaanin vaihtelun mitta.