Prueba T
¿Qué es una prueba T?
estadÃstica inferencial utilizada para determinar si existe una diferencia significativa entre las medias de dos grupos, que pueden estar relacionadas en ciertas caracterÃsticas. Se usa principalmente cuando los conjuntos de datos, como el conjunto de datos registrado como resultado de lanzar una moneda 100 veces, seguirÃan una distribución normal y podrÃan tener variaciones desconocidas. Una prueba t se utiliza como una herramienta de prueba de hipótesis, que permite probar una suposición aplicable a una población.
Una prueba t analiza la estadÃstica t, los valores de distribución t y los grados de libertad para determinar la significancia estadÃstica. Para realizar una prueba con tres o más medias, se debe utilizar un análisis de varianza.
Explicando la prueba T
Esencialmente, una prueba t nos permite comparar los valores promedio de los dos conjuntos de datos y determinar si provienen de la misma población. En los ejemplos anteriores, si tuviéramos que tomar una muestra de estudiantes de la clase A y otra muestra de estudiantes de la clase B, no esperarÃamos que tuvieran exactamente la misma media y desviación estándar. De manera similar, las muestras tomadas del grupo de control alimentado con placebo y las tomadas del grupo de medicamentos recetados deben tener una media y una desviación estándar ligeramente diferentes.
Matemáticamente, la prueba t toma una muestra de cada uno de los dos conjuntos y establece el enunciado del problema asumiendo una hipótesis nula de que las dos medias son iguales. Con base en las fórmulas aplicables, se calculan ciertos valores y se comparan con los valores estándar, y la hipótesis nula asumida se acepta o rechaza en consecuencia.
Si la hipótesis nula califica para ser rechazada, indica que las lecturas de datos son sólidas y probablemente no se deban al azar.
La prueba t es solo una de las muchas pruebas utilizadas para este propósito. Además, los estadÃsticos deben utilizar pruebas distintas de la prueba t para examinar más variables y pruebas con tamaños de muestra más grandes. Para un tamaño de muestra grande, los estadÃsticos usan una prueba z. Otras opciones de prueba incluyen la prueba de chi-cuadrado y la prueba f.
Hay tres tipos de pruebas t, y se clasifican como pruebas t dependientes e independientes.
Resultados de prueba ambiguos
Considere que un fabricante de medicamentos quiere probar un medicamento recién inventado. Sigue el procedimiento estándar de probar el fármaco en un grupo de pacientes y administrar un placebo a otro grupo, llamado grupo de control. El placebo administrado al grupo de control es una sustancia sin valor terapéutico previsto y sirve como punto de referencia para medir cómo responde el otro grupo, al que se le administra el fármaco real.
Después de la prueba del medicamento, los miembros del grupo de control alimentado con placebo informaron un aumento en la esperanza de vida promedio de tres años, mientras que los miembros del grupo al que se les recetó el nuevo medicamento informaron un aumento en la esperanza de vida promedio de cuatro años. La observación instantánea puede indicar que el fármaco está funcionando, ya que los resultados son mejores para el grupo que lo usa. Sin embargo, también es posible que la observación se deba a un hecho fortuito, especialmente a una suerte sorprendente. Una prueba t es útil para concluir si los resultados son realmente correctos y aplicables a toda la población.
En una escuela, 100 estudiantes de la clase A obtuvieron un promedio de 85 % con una desviación estándar de 3 %. Otros 100 estudiantes pertenecientes a la clase B obtuvieron un promedio de 87% con una desviación estándar de 4%. Si bien el promedio de la clase B es mejor que el de la clase A, puede que no sea correcto llegar a la conclusión de que el desempeño general de los estudiantes de la clase B es mejor que el de los estudiantes de la clase A. Esto se debe a que existe una variabilidad natural en los puntajes de las pruebas en ambas clases, por lo que la diferencia podrÃa deberse únicamente al azar. Una prueba t puede ayudar a determinar si a una clase le fue mejor que a la otra.
Supuestos de prueba T
La primera suposición hecha con respecto a las pruebas t se refiere a la escala de medición. La suposición de una prueba t es que la escala de medición aplicada a los datos recopilados sigue una escala continua u ordinal, como las puntuaciones de una prueba de coeficiente intelectual.
La segunda suposición que se hace es la de una muestra aleatoria simple, que los datos se recopilan de una porción representativa seleccionada al azar de la población total.
La tercera suposición es que los datos, cuando se grafican, dan como resultado una distribución normal, una curva de distribución en forma de campana.
El supuesto final es la homogeneidad de la varianza. Existe una varianza homogénea o igual cuando las desviaciones estándar de las muestras son aproximadamente iguales.
Cálculo de pruebas T
Calcular una prueba t requiere tres valores de datos clave. Incluyen la diferencia entre los valores medios de cada conjunto de datos (llamada diferencia de medias), la desviación estándar de cada grupo y la cantidad de valores de datos de cada grupo.
El resultado de la prueba t produce el valor t. Este valor t calculado se compara luego con un valor obtenido de una tabla de valores crÃticos (llamada Tabla de Distribución T). Esta comparación ayuda a determinar el efecto del azar solo en la diferencia y si la diferencia está fuera de ese rango de probabilidad. La prueba t cuestiona si la diferencia entre los grupos representa una verdadera diferencia en el estudio o si es posiblemente una diferencia aleatoria sin sentido.
Tablas de distribución T
La tabla de distribución T está disponible en formatos de una y dos colas . El primero se utiliza para evaluar casos que tienen un valor fijo o rango con una dirección clara (positiva o negativa). Por ejemplo, ¿cuál es la probabilidad de que el valor de salida permanezca por debajo de -3 o de obtener más de siete al lanzar un par de dados? Este último se utiliza para el análisis de lÃmite de rango, como preguntar si las coordenadas se encuentran entre -2 y +2.
Los cálculos se pueden realizar con programas de software estándar que admitan las funciones estadÃsticas necesarias, como las que se encuentran en MS Excel.
Valores T y grados de libertad
La prueba t produce dos valores como salida: valor t y grados de libertad. El valor t es una relación de la diferencia entre la media de los dos conjuntos de muestras y la variación que existe dentro de los conjuntos de muestras. Mientras que el valor del numerador (la diferencia entre la media de los dos conjuntos de muestras) es sencillo de calcular, el denominador (la variación que existe dentro de los conjuntos de muestras) puede volverse un poco complicado dependiendo del tipo de valores de datos involucrados. El denominador de la relación es una medida de la dispersión o variabilidad. Los valores más altos del valor t, también llamado puntuación t, indican que existe una gran diferencia entre los dos conjuntos de muestras. Cuanto más pequeño es el valor t, más similitud existe entre los dos conjuntos de muestras.
Una puntuación t grande indica que los grupos son diferentes.
Una puntuación t pequeña indica que los grupos son similares.
Los grados de libertad se refieren a los valores en un estudio que tiene la libertad de variar y son esenciales para evaluar la importancia y la validez de la hipótesis nula. El cálculo de estos valores generalmente depende del número de registros de datos disponibles en el conjunto de muestra.
Prueba T correlacionada (o emparejada)
La prueba t correlacionada se realiza cuando las muestras suelen consistir en pares emparejados de unidades similares, o cuando hay casos de medidas repetidas. Por ejemplo, puede haber instancias de los mismos pacientes que se someten a pruebas repetidamente, antes y después de recibir un tratamiento en particular. En tales casos, cada paciente se utiliza como muestra de control contra sà mismo.
Este método también se aplica a los casos en que las muestras están relacionadas de alguna manera o tienen caracterÃsticas coincidentes, como un análisis comparativo que involucra a niños, padres o hermanos. Las pruebas t correlacionadas o pareadas son de tipo dependiente, ya que implican casos en los que los dos conjuntos de muestras están relacionados.
La fórmula para calcular el valor t y los grados de libertad para una prueba t pareada es:
<span class="katex-html" aria -hidden="true">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="mord">​< lapso class="vlist-t vlist-t2">T=< /span>(n)
c-2.7,0,-7.17,-2.7,-13.5,-8c-5.8,-5.3,-9.5,-10,-9.5,-14
c0,-2,0.3,-3.3,1,-4c1.3,-2.7,23.83,-20.7,67.5,-54
c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2,5,-2c4.7,0,8.7,3.3,12,10
s173,378,173,378c0.7,0,35.3,-71,104,-213c68.7,-142,137.5,-285,206.5,-429
c69,-144,104.5,-217.7,106.5,-221
l0 -0
c5.3,-9.3,12,-14,20,-14
H400000v40H845.2724
s-225.272,467,-225.272,467s-235,486,-235,486c-2.7,4.7,-9,7,-19,7
c-6,0,-10,-1,-12,-3s-194,-422,-194,-422s-65,47,-65,47z
M834 80h400000v40h-400000z'/>​ s(</ span>diff)</ span>​ </ span>media1−media2< span class="vlist-s">​</ span>donde:< /span>media 1 y media2</ span>=Los valores promedio de cada uno de los conjuntos de muestras(diff )=La desviación estándar de las diferencias de los valores de datos emparejados n< abarcan clase="mrel">=El tamaño de la muestra (la cantidad de diferencias pareadas)n−1=Los grados de libertad​
Los dos tipos restantes pertenecen a las pruebas t independientes. Las muestras de estos tipos se seleccionan de forma independiente, es decir, los conjuntos de datos de los dos grupos no se refieren a los mismos valores. Incluyen casos como un grupo de 100 pacientes que se divide en dos conjuntos de 50 pacientes cada uno. Uno de los grupos se convierte en el grupo de control y recibe un placebo, mientras que el otro grupo recibe el tratamiento prescrito. Esto constituye dos grupos de muestra independientes que no están emparejados entre sÃ.
Prueba T de varianza igual (o agrupada)
La prueba t de igual varianza se usa cuando el número de muestras en cada grupo es el mismo, o la varianza de los dos conjuntos de datos es similar. La siguiente fórmula se utiliza para calcular el valor t y los grados de libertad para la prueba t de igual varianza:
l0 -0
c4,-6.7,10,-10,18,-10 H400000v40
H1013.1s-83.4,268,-264.1,840c-180.7,572,-277,876.3,-289,913c-4.7,4.7,-12.7,7,-24,7
s-12,0,-12,0c-1.3,-3.3,-3.7,-11.7,-7,-25c-35.3,-125.3,-106.7,-373.3,-214,-744
c-10,12,-21,25,-33,39s-32,39,-32,39c-6,-5.3,-15,-14,-27,-26s25,-30,25,-30
c26.7,-32.7,52,-63,76,-91s52,-60,52,-60s208,722,208,722
c56,-175.3,126.3,-397.3,211,-666c84.7,-268.7,153.8,-488.2,207.5,-658.5
c53.7,-170.3,84.5,-266.8,92.5,-289.5z
M1001 80h400000v40h-400000z'/>​ < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< abarcan clase="mord matemáticasnormales">ean2​donde:< /span>mea< abarcan clase="mord mathnormal">n1 y </ span>mean2< abarcan clase="mspace" style="margen-derecho:0.2777777777777778em;">=Valores promedio de cada uno< span class="mord text">de los conjuntos de muestra< abarcan clase="pstrut" estilo="altura:3.32144em;">var 1 y var2= Varianza de cada uno de los conjuntos de muestran1 y n2= Número de registros en cada conjunto de muestra​</ intervalo>
y,
Prueba T de varianza desigual
La prueba t de varianza desigual se usa cuando el número de muestras en cada grupo es diferente y la varianza de los dos conjuntos de datos también es diferente. Esta prueba también se llama prueba t de Welch. La siguiente fórmula se utiliza para calcular el valor t y los grados de libertad para una prueba t de varianza desigual:
c339.3,-1799.3,509.3,-2700,510,-2702 l0 -0
c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7
s-90.5,478,-276.2,1466c-185.7,988,-279.5,1483,-281.5,1485c-2,6,-10,9,-24,9
c-8,0,-12,-0.7,-12,-2c0,-1.3,-5.3,-32,-16,-92c-50.7,-293.3,-119.7,-693.3,-207,-1200
c0,-1.3,-5.3,8.7,-16,30c-10.7,21.3,-21.3,42.7,-32,64s-16,33,-16,33s-26,-26,-26,-26
s76,-153,76,-153s77,-151,77,-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,104,
606zM1001 80h400000v40H1017.7z'/>​ < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< abarcan clase="mord matemáticasnormales">ean2​< abarcan clase="vlist" style="altura:2.93em;"></ span>donde: mea n1 y < /span>mean2=Valores promedio de cada de los conjuntos de muestravar1 y v ar2=</ span>Varianza de cada uno de los conjuntos de muestran1 y n2=Número de registros en cada conjunto de muestra​
y,
< span class="katex-html" aria-hidden="true">< /span>​ </sp an>Grados de libertad< /span>= </ span>n1< /span>−1< /span>( n1 < span class="pstrut" style="height:3em;">var1< span class="vlist-r">2​)2​</ span></ span>+n2−1</ span>(< span class="mord mtight">n2< /span>var< /span>22 ​< /span>) 2< /span>​ (n1var1< span class="vlist-r">2</ span>​< /span>< /span>+ n2< /span> v</ span>ar2</ span>2 ​ )2 ​donde:var< abarcan class="mord">1 y var</ span>2=</ span>Varianza de cada uno de los conjuntos de muestran1 y < span class="mord mathnormal">n2< abarcan clase="mrel">=Número de registros en cada conjunto de muestra​</ intervalo>
Determinar la prueba T correcta para usar
El siguiente diagrama de flujo se puede usar para determinar qué prueba t se debe usar en función de las caracterÃsticas de los conjuntos de muestras. Los elementos clave a considerar incluyen si los registros de muestra son similares, la cantidad de registros de datos en cada conjunto de muestra y la varianza de cada conjunto de muestra.
Ejemplo de prueba T de varianza desigual
Supongamos que estamos tomando una medida diagonal de las pinturas recibidas en una galerÃa de arte. Un grupo de muestras incluye 10 pinturas, mientras que el otro incluye 20 pinturas. Los conjuntos de datos, con los correspondientes valores de media y varianza, son los siguientes:
TTT
Aunque la media del Conjunto 2 es más alta que la del Conjunto 1, no podemos concluir que la población correspondiente al Conjunto 2 tenga una media más alta que la población correspondiente al Conjunto 1. ¿La diferencia de 19.4 a 21.6 se debe únicamente al azar, o no? ¿Realmente existen diferencias en las poblaciones totales de todas las pinturas recibidas en la galerÃa de arte? Establecemos el problema asumiendo la hipótesis nula de que la media es la misma entre los dos conjuntos de muestras y realizamos una prueba t para comprobar si la hipótesis es plausible.
Dado que el número de registros de datos es diferente (n1 = 10 y n2 = 20) y la varianza también es diferente, el valor t y los grados de libertad se calculan para el conjunto de datos anterior utilizando la fórmula mencionada en la prueba T de varianza desigual sección.
El valor t es -2.24787. Dado que el signo menos se puede ignorar al comparar los dos valores t, el valor calculado es 2,24787.
El valor de los grados de libertad es 24,38 y se reduce a 24, debido a que la definición de la fórmula requiere el redondeo del valor al menor valor entero posible.
Se puede especificar un nivel de probabilidad (nivel alfa, nivel de significación, p) como criterio de aceptación. En la mayorÃa de los casos, se puede suponer un valor del 5%.
Usando el valor del grado de libertad como 24 y un nivel de significancia del 5%, una mirada a la tabla de distribución del valor t da un valor de 2.064. La comparación de este valor con el valor calculado de 2,247 indica que el valor t calculado es mayor que el valor de la tabla con un nivel de significancia del 5 %. Por lo tanto, es seguro rechazar la hipótesis nula de que no hay diferencia entre las medias. El conjunto poblacional tiene diferencias intrÃnsecas, y no son por casualidad.
Reflejos
Una prueba t es un tipo de estadÃstica inferencial utilizada para determinar si existe una diferencia significativa entre las medias de dos grupos, que pueden estar relacionadas en ciertas caracterÃsticas.
La prueba t es una de las muchas pruebas utilizadas con el propósito de probar hipótesis en estadÃstica.
Hay varios tipos diferentes de pruebas t que se pueden realizar según los datos y el tipo de análisis requerido.
El cálculo de una prueba t requiere tres valores de datos clave. Incluyen la diferencia entre los valores medios de cada conjunto de datos (llamada diferencia de medias), la desviación estándar de cada grupo y la cantidad de valores de datos de cada grupo.