To-halet test
Hvad er en to-halet test?
En tosidet test, i statistik, er en metode, hvor det kritiske område af en fordeling er tosidet og tester, om en stikprøve er større end eller mindre end et bestemt værdiområde. Det bruges i n ull-hypotesetestning og test for statistisk signifikans. Hvis prøven, der testes, falder inden for et af de kritiske områder, accepteres den alternative hypotese i stedet for nulhypotesen.
Forståelse af en to-halet test
Et grundlæggende koncept for inferentiel statistik er hypotesetestning,. som afgør, om en påstand er sand eller ej givet en populationsparameter. En hypotesetest, der er designet til at vise, om gennemsnittet af en prøve er signifikant større end og signifikant mindre end gennemsnittet af en population, kaldes en to-halet test. Den to-halede test får sit navn fra at teste området under begge haler af en normal fordeling,. selvom testen kan bruges i andre ikke-normale fordelinger .
En tosidet test er designet til at undersøge begge sider af et specificeret dataområde som angivet af den involverede sandsynlighedsfordeling. Sandsynlighedsfordelingen bør repræsentere sandsynligheden for et specificeret resultat baseret på forudbestemte standarder. Dette kræver indstilling af en grænse, der angiver de højeste (eller øvre) og laveste (eller laveste) accepterede variabelværdier inkluderet i området. Ethvert datapunkt, der eksisterer over den øvre grænse eller under den nedre grænse, betragtes som uden for acceptområdet og i et område, der omtales som afvisningsområdet.
Der er ingen iboende standard for antallet af datapunkter, der skal eksistere inden for acceptintervallet. I tilfælde, hvor præcision er påkrævet, såsom ved fremstilling af farmaceutiske lægemidler, kan en afvisningsrate på 0,001 % eller mindre indføres. I tilfælde, hvor præcision er mindre kritisk, såsom antallet af fødevarer i en produktpose, kan en afvisningsprocent på 5 % være passende.
Særlige overvejelser
En tosidet test kan også praktisk taget bruges under visse produktionsaktiviteter i en virksomhed, såsom med produktion og pakning af slik på et bestemt anlæg. Hvis produktionsanlægget udpeger 50 slik pr. pose som sit mål, med en acceptabel fordeling på 45 til 55 slik, anses enhver pose fundet med en mængde under 45 eller over 55 inden for afvisningsintervallet.
For at bekræfte, at emballeringsmekanismerne er korrekt kalibreret til at opfylde det forventede output, kan der tages stikprøver for at bekræfte nøjagtigheden. En simpel tilfældig stikprøve tager en lille, tilfældig del af hele populationen for at repræsentere hele datasættet, hvor hvert medlem har lige stor sandsynlighed for at blive valgt.
For at emballeringsmekanismerne skal anses for nøjagtige, ønskes et gennemsnit på 50 slik pr. pose med en passende fordeling. Derudover skal antallet af poser, der falder inden for afvisningsområdet, falde inden for den sandsynlighedsfordelingsgrænse, der anses for acceptabel som en fejlrate. Her ville nulhypotesen være, at middelværdien er 50, mens den alternative hypotese ville være, at den ikke er 50.
z-scoren efter udførelse af den tosidede test falder i afvisningsområdet, hvilket betyder, at afvigelsen er for langt fra det ønskede middelværdi, kan det være nødvendigt at foretage justeringer af anlægget eller tilhørende udstyr for at rette fejlen. Regelmæssig brug af tosidede testmetoder kan hjælpe med at sikre, at produktionen forbliver inden for grænserne på lang sigt.
Vær omhyggelig med at bemærke, om en statistisk test er en- eller tosidet, da dette vil have stor indflydelse på en models fortolkning.
Two-tailed vs. en-tailed test
Når en hypotesetest er sat op til at vise, at stikprøvegennemsnittet ville være højere eller lavere end populationsmiddelværdien, omtales dette som en ensidet test. Den en-halede test får sit navn fra at teste området under en af halerne (siderne) af en normalfordeling. Når man bruger en ensidet test, tester en analytiker for muligheden for forholdet i én retning af interesse, og ser fuldstændig bort fra muligheden for et forhold i en anden retning.
Hvis prøven, der testes, falder i det ensidige kritiske område, vil den alternative hypotese blive accepteret i stedet for nulhypotesen. En ensidet test er også kendt som en retningsbestemt hypotese eller retningsbestemt test.
En tosidet test er på den anden side designet til at undersøge begge sider af et specificeret dataområde for at teste, om en prøve er større end eller mindre end værdiintervallet.
Eksempel på en to-halet test
Forestil dig som et hypotetisk eksempel, at en ny børsmægler,. ved navn XYZ, hævder, at deres mæglergebyrer er lavere end din nuværende børsmæglers, ABC. Data tilgængelige fra et uafhængigt analysefirma indikerer, at gennemsnittet og standardafvigelsen for alle ABC-mæglerkunder er $18 og $6, henholdsvis.
Der tages en prøve på 100 kunder hos ABC, og mæglergebyrer beregnes med de nye satser for XYZ-mægler. Hvis gennemsnittet af prøven er $18,75, og prøvens standardafvigelse er $6, kan der så drages nogen slutning om forskellen i den gennemsnitlige mæglerregning mellem ABC og XYZ-mægler?
H0: Nulhypotese: middel = 18
H1: Alternativ hypotese: middelværdi <> 18 (Dette er, hvad vi ønsker at bevise.)
Afvisningsområde: Z <= - Z2,5 og Z>=Z2,5 (forudsat 5 % signifikansniveau, delt 2,5 hver på hver side).
Z = (prøvemiddel – middel) / (std-dev / sqrt (antal prøver)) = (18,75 – 18) / (6/(sqrt(100)) = 1,25
Denne beregnede Z-værdi falder mellem de to grænser defineret ved: - Z2,5 = -1,96 og Z2,5 = 1,96.
Dette konkluderer, at der ikke er tilstrækkeligt bevis til at udlede, at der er nogen forskel mellem satserne for din eksisterende mægler og den nye mægler. Derfor kan nulhypotesen ikke forkastes. Alternativt fører p-værdien = P(Z< -1,25)+P(Z >1,25) = 2 * 0,1056 = 0,2112 = 21,12 %, hvilket er større end 0,05 eller 5 %, til samme konklusion.
Højdepunkter
Ifølge konventionen bruges to-halede tests til at bestemme signifikans på 5%-niveauet, hvilket betyder, at hver side af fordelingen er skåret ved 2,5%.
I statistik er en tosidet test en metode, hvor det kritiske område af en fordeling er tosidet og tester, om en stikprøve er større eller mindre end en række værdier.
Det bruges i nulhypotesetestning og test for statistisk signifikans.
Hvis prøven, der testes, falder inden for et af de kritiske områder, accepteres den alternative hypotese i stedet for nulhypotesen.
Ofte stillede spørgsmål
Hvad er en Z-score?
En Z-score beskriver numerisk en værdis forhold til middelværdien af en gruppe værdier og måles i form af antallet af standardafvigelser fra middelværdien. Hvis en Z-score er 0, indikerer det, at datapunktets score er identisk med den gennemsnitlige score, hvorimod Z-score på 1,0 og -1,0 ville angive værdier en standardafvigelse over eller under middelværdien. I de fleste store datasæt har 99 % af værdierne en Z-score mellem -3 og 3, hvilket betyder, at de ligger inden for tre standardafvigelser over og under middelværdien.
Hvordan er en to-halet test designet?
En tosidet test er designet til at bestemme, om en påstand er sand eller ej givet en populationsparameter. Den undersøger begge sider af et specificeret dataområde som angivet af den involverede sandsynlighedsfordeling. Som sådan bør sandsynlighedsfordelingen repræsentere sandsynligheden for et specificeret resultat baseret på forudbestemte standarder.
Hvad er forskellen mellem en to-halet og en-halet test?
En tosidet hypotesetest er designet til at vise, om stikprøvegennemsnittet er signifikant større end og signifikant mindre end gennemsnittet af en population. Den to-halede test får sit navn fra at teste området under begge haler (sider) af en normalfordeling. En ensidet hypotesetest er på den anden side sat op for at vise, at stikprøvegennemsnittet ville være højere eller lavere end populationsgennemsnittet.