Investor's wiki

Grader af frihed

Grader af frihed

Hvad er frihedsgrader?

Frihedsgrader refererer til det maksimale antal logisk uafhængige værdier, som er værdier, der har frihed til at variere, i dataprøven.

Forståelse af frihedsgrader

Den nemmeste måde at forstå frihedsgrader konceptuelt er gennem et eksempel:

  • Overvej en dataprøve bestÃ¥ende af, for nemheds skyld, fem positive heltal. Værdierne kan være et hvilket som helst tal uden nogen kendt sammenhæng mellem dem. Denne dataprøve ville teoretisk set have fem frihedsgrader.

  • Fire af tallene i stikprøven er {3, 8, 5 og 4}, og gennemsnittet af hele dataprøven viser sig at være 6.

  • Det mÃ¥ betyde, at det femte tal skal være 10. Det kan ikke være andet. Den har ikke frihed til at variere.

  • SÃ¥ frihedsgraderne for denne dataprøve er 4.

Formlen for frihedsgrader svarer til størrelsen af dataprøven minus én:

Df= N−1 hvor: Df=frihedsgraderN=prøvestørrelse\begin &\text\text = N - 1 \ &\textbf \ &\text\text = \tekst \ &N = \tekst{prøvestørrelse} \ \end

Frihedsgrader diskuteres almindeligvis i forhold til forskellige former for hypotesetestning i statistik, såsom en chi-kvadrat. Det er vigtigt at beregne frihedsgrader, når man forsøger at forstå vigtigheden af en chi-kvadrat-statistik og gyldigheden af nulhypotesen.

Chi-Square Tests

Der er to forskellige slags chi-kvadrat-tests : testen af uafhængighed, som stiller et spørgsmål om forhold, såsom: "Er der en sammenhæng mellem køn og SAT-score?"; og goodness-of-fit-testen,. der spørger noget som "Hvis en mønt kastes 100 gange, vil den så komme op i hovedet 50 gange og haler 50 gange?"

Til disse tests bruges frihedsgrader til at bestemme, om en bestemt nulhypotese kan forkastes baseret på det samlede antal variabler og prøver i eksperimentet. For eksempel, når man overvejer studerende og kursusvalg, er en stikprøvestørrelse på 30 eller 40 studerende sandsynligvis ikke stor nok til at generere væsentlige data. At få de samme eller lignende resultater fra en undersøgelse med en stikprøvestørrelse på 400 eller 500 studerende er mere gyldigt.

Historie om frihedsgrader

Det tidligste og mest grundlæggende begreb om frihedsgrader blev bemærket i begyndelsen af 1800-tallet, sammenflettet i matematikeren og astronomen Carl Friedrich Gauss' værker. Den moderne brug og forståelse af begrebet blev først forklaret af William Sealy Gosset, en engelsk statistiker, i hans artikel "The Probable Error of a Mean", offentliggjort i Biometrika i 1908 under et pennenavn for at bevare hans anonymitet.

I sine skrifter brugte Gosset ikke specifikt udtrykket "frihedsgrader". Han gav dog en forklaring på konceptet i løbet af udviklingen af, hvad der i sidste ende ville blive kendt som Student's T-distribution. Selve begrebet blev først populært i 1922. Den engelske biolog og statistiker Ronald Fisher begyndte at bruge udtrykket "grader af frihed", da han begyndte at udgive rapporter og data om sit arbejde med at udvikle chi-kvadrater.

Højdepunkter

  • Frihedsgrader er almindeligt diskuteret i forhold til forskellige former for hypotesetestning i statistik, sÃ¥som en chi-kvadrat.

  • Frihedsgrader refererer til det maksimale antal logisk uafhængige værdier, som er værdier, der har frihed til at variere, i dataprøven.

  • Beregning af frihedsgrader er nøglen, nÃ¥r man forsøger at forstÃ¥ vigtigheden af en chi-kvadrat-statistik og gyldigheden af nulhypotesen.