Grader av frihet
Hva er frihetsgrader?
Frihetsgrader refererer til det maksimale antallet logisk uavhengige verdier, som er verdier som har frihet til å variere, i datautvalget.
Forstå grader av frihet
Den enkleste måten å forstå grader av frihet konseptuelt er gjennom et eksempel:
Tenk på en dataprøve bestående av, for enkelhets skyld, fem positive heltall. Verdiene kan være et hvilket som helst tall uten kjent sammenheng mellom dem. Dette datautvalget ville teoretisk sett ha fem frihetsgrader.
Fire av tallene i utvalget er {3, 8, 5 og 4} og gjennomsnittet av hele datautvalget viser seg å være 6.
– Dette må bety at det femte tallet må være 10. Det kan ikke være noe annet. Den har ikke frihet til å variere.
– Så frihetsgradene for denne dataprøven er 4.
Formelen for frihetsgrader tilsvarer størrelsen på datautvalget minus én:
Frihetsgrader er ofte diskutert i forhold til ulike former for hypotesetesting i statistikk, for eksempel en kjikvadrat. Det er viktig å beregne frihetsgrader når man prøver å forstå viktigheten av en kjikvadratstatistikk og gyldigheten av nullhypotesen.
Chi-Square-tester
Det er to forskjellige typer kjikvadrat-tester : uavhengighetstesten, som stiller et spørsmål om forhold, for eksempel "Er det en sammenheng mellom kjønn og SAT-score?"; og godhetstesten,. som spør noe sånt som "Hvis en mynt kastes 100 ganger, vil den komme opp 50 ganger og haler 50 ganger?"
For disse testene brukes frihetsgrader for å bestemme om en viss nullhypotese kan forkastes basert på det totale antallet variabler og prøver i eksperimentet. For eksempel, når man vurderer studenter og emnevalg, er en prøvestørrelse på 30 eller 40 studenter sannsynligvis ikke stor nok til å generere betydelige data. Å få samme eller lignende resultater fra en studie med en prøvestørrelse på 400 eller 500 studenter er mer gyldig.
Historie om frihetsgrader
Det tidligste og mest grunnleggende konseptet om frihetsgrader ble notert på begynnelsen av 1800-tallet, sammenvevd i verkene til matematikeren og astronomen Carl Friedrich Gauss. Den moderne bruken og forståelsen av begrepet ble forklart først av William Sealy Gosset, en engelsk statistiker, i sin artikkel "The Probable Error of a Mean", publisert i Biometrika i 1908 under et pennenavn for å bevare hans anonymitet.
I sine skrifter brukte ikke Gosset spesifikt begrepet «frihetsgrader». Han ga imidlertid en forklaring på konseptet i løpet av utviklingen av det som til slutt skulle bli kjent som Student's T-distribution. Selve begrepet ble ikke gjort populært før i 1922. Den engelske biologen og statistikeren Ronald Fisher begynte å bruke begrepet «frihetsgrader» da han begynte å publisere rapporter og data om sitt arbeid med å utvikle chi-kvadrater.
Høydepunkter
– Frihetsgrader er vanlig å diskutere i forhold til ulike former for hypotesetesting i statistikk, for eksempel en kjikvadrat.
– Frihetsgrader refererer til maksimalt antall logisk uavhengige verdier, som er verdier som har frihet til å variere, i datautvalget.
– Å beregne frihetsgrader er nøkkelen når man prøver å forstå viktigheten av en kjikvadratstatistikk og gyldigheten av nullhypotesen.