Investor's wiki

Vapauden asteet

Vapauden asteet

Mitä ovat vapausasteet?

Vapausasteet viittaavat loogisesti riippumattomien arvojen enimmäismäärään, jotka ovat arvoja, joilla on vapaus vaihdella, datanäytteessä.

Vapausasteiden ymmärtäminen

Helpoin tapa ymmärtää vapausasteita käsitteellisesti on esimerkki:

  • Tarkastellaan tietootosta, joka koostuu yksinkertaisuuden vuoksi viidestä positiivisesta kokonaisluvusta. Arvot voivat olla mikä tahansa luku ilman tunnettua yhteyttä niiden välillä. Tällä datanäytteellä olisi teoriassa viisi vapausastetta.

  • Neljä otoksen luvuista ovat {3, 8, 5 ja 4}, ja koko datanäytteen keskiarvoksi paljastuu 6.

  • Tämän täytyy tarkoittaa, että viidennen numeron on oltava 10. Se ei voi olla mitään muuta. Sillä ei ole vapautta vaihdella.

  • Tämän datanäytteen vapausasteet ovat siis 4.

Vapausasteiden kaava vastaa datanäytteen kokoa miinus yksi:

Df= N1 missä: Df=vapausasteetN=näytteen koko\begin &\teksti\teksti = N - 1 \ &\textbf \ &\teksti\teksti = \teksti \ &N = \text{näytteen koko} \ \end

Vapausasteita käsitellään yleisesti tilastoissa erilaisten hypoteesitestausten, kuten khin-neliön, yhteydessä. On oleellista laskea vapausasteet, kun yritetään ymmärtää khin neliön tilaston tärkeyttä ja nollahypoteesin pätevyyttä.

Chi-neliötestit

On olemassa kahdenlaisia chi-neliötestejä : riippumattomuustesti, joka kysyy suhteesta, kuten "Onko sukupuolen ja SAT-pisteiden välillä suhdetta?"; ja sopivuustesti,. joka kysyy esimerkiksi "Jos kolikkoa heitetään 100 kertaa, nouseeko se päätä 50 kertaa ja häntä 50 kertaa?"

Näissä testeissä vapausasteita käytetään määrittämään, voidaanko tietty nollahypoteesi hylätä kokeen muuttujien ja näytteiden kokonaismäärän perusteella. Esimerkiksi opiskelijoiden ja kurssin valintaa harkittaessa 30 tai 40 opiskelijan otos ei todennäköisesti ole tarpeeksi suuri tuottamaan merkittävää dataa. Saman tai samankaltaisen tuloksen saaminen tutkimuksesta, jossa käytetään 400 tai 500 opiskelijan otoskokoa, on pätevämpää.

Vapausasteiden historia

Varhaisin ja yksinkertaisin käsite vapausasteista havaittiin 1800-luvun alussa, ja se kietoutui matemaatikon ja tähtitieteilijän Carl Friedrich Gaussin töihin. Termin nykyaikaista käyttöä ja ymmärtämistä selitti ensin englantilainen tilastotieteilijä William Sealy Gosset artikkelissaan "The Probable Error of a Mean", joka julkaistiin Biometrikassa vuonna 1908 kirjaimella nimettömyytensä säilyttämiseksi.

Kirjoituksissaan Gosset ei käyttänyt nimenomaisesti termiä "vapausasteet". Hän antoi kuitenkin selityksen konseptille koko ajan kehitettäessä sitä, mikä lopulta tunnettaisiin nimellä Studentin T-jakauma. Varsinainen termi tehtiin suosituksi vasta vuonna 1922. Englantilainen biologi ja tilastotieteilijä Ronald Fisher alkoi käyttää termiä "vapausasteet", kun hän alkoi julkaista raportteja ja tietoja työstään chi-neliöiden kehittämisessä.

Kohokohdat

  • Vapausasteita puhutaan yleisesti erilaisten hypoteesien testauksen muodoissa tilastoissa, kuten khi-neliössä.

  • Vapausasteet viittaavat loogisesti riippumattomien arvojen enimmäismäärään, jotka ovat arvoja, joilla on vapaus vaihdella, datanäytteessä.

  • Vapausasteiden laskeminen on avainasemassa, kun yritetään ymmärtää khin neliön tilaston tärkeyttä ja nollahypoteesin pätevyyttä.