Konfidensintervall

Hva er konfidensintervall?

Et konfidensintervall, i statistikk, refererer til sannsynligheten for at en populasjonsparameter vil falle mellom et sett med verdier i en viss andel ganger.

Forstå konfidensintervaller

Konfidensintervaller måler graden av usikkerhet eller sikkerhet i en prøvetakingsmetode. De kan ta et hvilket som helst antall sannsynlighetsgrenser, hvor det vanligste er et 95 % eller 99 % konfidensnivå. Konfidensintervaller utføres ved hjelp av statistiske metoder, for eksempel en t-test.

Statistikere bruker konfidensintervaller for å måle usikkerhet i en utvalgsvariabel. For eksempel velger en forsker forskjellige utvalg tilfeldig fra den samme populasjonen og beregner et konfidensintervall for hvert utvalg for å se hvordan det kan representere den sanne verdien av populasjonsvariabelen. De resulterende datasettene er alle forskjellige; noen intervaller inkluderer den sanne populasjonsparameteren og andre ikke.

Et konfidensintervall er et verdiområde, avgrenset over og under statistikkens gjennomsnitt,. som sannsynligvis vil inneholde en ukjent populasjonsparameter. Konfidensnivå refererer til prosentandelen av sannsynlighet, eller sikkerhet, for at konfidensintervallet vil inneholde den sanne populasjonsparameteren når du trekker et tilfeldig utvalg mange ganger. Eller, på folkemunne, "vi er 99 % sikre (konfidensnivå) på at de fleste av disse prøvene (konfidensintervaller) inneholder den sanne populasjonsparameteren."

Den største misforståelsen angående konfidensintervaller er at de representerer prosentandelen av data fra et gitt utvalg som faller mellom øvre og nedre grenser. For eksempel kan man feilaktig tolke det nevnte 99 % konfidensintervallet på 70 til 78 tommer som å indikere at 99 % av dataene i et tilfeldig utvalg faller mellom disse tallene. Dette er feil, selv om det finnes en egen metode for statistisk analyse for å gjøre en slik bestemmelse. Å gjøre det innebærer å identifisere prøvens gjennomsnitt og standardavvik og plotte disse tallene på en klokkekurve.

Konfidensintervall og konfidensnivå henger sammen, men er ikke helt det samme.

Beregner konfidensintervall

Anta at en gruppe forskere studerer høyden til basketballspillere på videregående skoler. Forskerne tar et tilfeldig utvalg fra befolkningen og fastslår en gjennomsnittlig høyde på 74 tommer.

Gjennomsnittet på 74 tommer er et punktestimat av gjennomsnittet av befolkningen. Et punktestimat i seg selv er av begrenset nytte fordi det ikke avslører usikkerheten knyttet til estimatet; du har ikke en god følelse av hvor langt unna dette 74-tommers gjennomsnittet kan være fra populasjonsgjennomsnittet. Det som mangler er graden av usikkerhet i denne enkeltprøven.

Konfidensintervaller gir mer informasjon enn punktanslag. Ved å etablere et 95 % konfidensintervall ved å bruke prøvens gjennomsnitt og standardavvik,. og anta en normalfordeling som representert av klokkekurven, kommer forskerne til en øvre og nedre grense som inneholder det sanne gjennomsnittet 95 % av tiden.

Anta at intervallet er mellom 72 tommer og 76 tommer. Hvis forskerne tar 100 tilfeldige prøver fra populasjonen av basketballspillere på videregående skoler som helhet, bør gjennomsnittet falle mellom 72 og 76 tommer i 95 av disse prøvene.

Hvis forskerne ønsker enda større tillit, kan de utvide intervallet til 99 % konfidens. Å gjøre det skaper alltid et bredere spekter, siden det gir plass til et større antall prøvemidler. Hvis de fastslår at 99 % konfidensintervall er mellom 70 tommer og 78 tommer, kan de forvente at 99 av 100 prøver som er evaluert inneholder en middelverdi mellom disse tallene.

Et 90 % konfidensnivå, derimot, innebærer at vi forventer at 90 % av intervallestimatene inkluderer populasjonsparameteren, og så videre.

Høydepunkter

De er oftest konstruert ved å bruke konfidensnivåer på 95 % eller 99 %.
Et konfidensintervall viser sannsynligheten for at en parameter vil falle mellom et par verdier rundt gjennomsnittet.

– Konfidensintervaller måler graden av usikkerhet eller sikkerhet i en prøvetakingsmetode.

FAQ

Hva er en vanlig misoppfatning om konfidensintervaller?

Den største misforståelsen angående konfidensintervaller er at de representerer prosentandelen av data fra et gitt utvalg som faller mellom øvre og nedre grenser. Det vil med andre ord være feil å anta at et 99 % konfidensintervall betyr at 99 % av dataene i et tilfeldig utvalg faller mellom disse grensene. Det det faktisk betyr er at man kan være 99 % sikker på at området vil inneholde populasjonsgjennomsnittet.

Hva er en T-test?

Konfidensintervaller utføres ved hjelp av statistiske metoder, for eksempel en t-test. En t-test er en type inferensiell statistikk som brukes til å bestemme om det er en signifikant forskjell mellom middelverdiene til to grupper, som kan være relatert til visse funksjoner. Å beregne en t-test krever tre nøkkeldataverdier. De inkluderer forskjellen mellom gjennomsnittsverdiene fra hvert datasett (kalt gjennomsnittlig forskjell), standardavviket for hver gruppe og antall dataverdier for hver gruppe.

Hva avslører et konfidensintervall?

Et konfidensintervall er et område av verdier, avgrenset over og under statistikkens gjennomsnitt, som sannsynligvis vil inneholde en ukjent populasjonsparameter. Konfidensnivå refererer til prosentandelen av sannsynlighet, eller sikkerhet, for at konfidensintervallet vil inneholde den sanne populasjonsparameteren når du trekker et tilfeldig utvalg mange ganger.

Hvordan brukes konfidensintervaller?

Statistikere bruker konfidensintervaller for å måle usikkerhet i en utvalgsvariabel. For eksempel velger en forsker forskjellige utvalg tilfeldig fra den samme populasjonen og beregner et konfidensintervall for hvert utvalg for å se hvordan det kan representere den sanne verdien av populasjonsvariabelen. De resulterende datasettene er alle forskjellige der noen intervaller inkluderer den sanne populasjonsparameteren og andre ikke.