Prueba de dos colas
¿Qué es una prueba de dos colas?
Una prueba de dos colas, en estadística, es un método en el que el área crítica de una distribución es de dos colas y prueba si una muestra es mayor o menor que un cierto rango de valores. Se utiliza en pruebas de hipótesis nulas y pruebas de significación estadística. Si la muestra que se está probando cae en alguna de las áreas críticas, se acepta la hipótesis alternativa en lugar de la hipótesis nula.
Comprender una prueba de dos colas
Un concepto básico de la estadística inferencial es la prueba de hipótesis,. que determina si una afirmación es cierta o no dado un parámetro de población. Una prueba de hipótesis que está diseñada para mostrar si la media de una muestra es significativamente mayor y significativamente menor que la media de una población se conoce como prueba de dos colas. La prueba de dos colas recibe su nombre de probar el área debajo de ambas colas de una distribución normal,. aunque la prueba se puede usar en otras distribuciones no normales .
Una prueba de dos colas está diseñada para examinar ambos lados de un rango de datos especificado según lo designado por la distribución de probabilidad involucrada. La distribución de probabilidad debe representar la probabilidad de un resultado específico basado en estándares predeterminados. Esto requiere el establecimiento de un límite que designe los valores variables aceptados más altos (o superiores) y más bajos (o inferiores) incluidos dentro del rango. Cualquier punto de datos que exista por encima del límite superior o por debajo del límite inferior se considera fuera del rango de aceptación y en un área denominada rango de rechazo.
No existe un estándar inherente sobre la cantidad de puntos de datos que deben existir dentro del rango de aceptación. En los casos en que se requiere precisión, como en la creación de fármacos, se puede instituir una tasa de rechazo de 0,001% o menos. En los casos en que la precisión es menos crítica, como la cantidad de alimentos en una bolsa de producto, una tasa de rechazo del 5 % puede ser apropiada.
Consideraciones Especiales
Una prueba de dos colas también se puede usar prácticamente durante ciertas actividades de producción en una empresa, como la producción y el empaque de dulces en una instalación en particular. Si la planta de producción designa como objetivo 50 dulces por bolsa, con una distribución aceptable de 45 a 55 dulces, cualquier bolsa que se encuentre con una cantidad inferior a 45 o superior a 55 se considera dentro del rango de rechazo.
Para confirmar que los mecanismos de empaque están correctamente calibrados para cumplir con el resultado esperado, se pueden tomar muestras al azar para confirmar la precisión. Una muestra aleatoria simple toma una pequeña porción aleatoria de toda la población para representar todo el conjunto de datos, donde cada miembro tiene la misma probabilidad de ser elegido.
Para que los mecanismos de empaque se consideren precisos, se desea un promedio de 50 caramelos por bolsa con una distribución adecuada. Además, la cantidad de bolsas que se encuentran dentro del rango de rechazo debe estar dentro del límite de distribución de probabilidad que se considera aceptable como tasa de error. Aquí, la hipótesis nula sería que la media es 50 mientras que la hipótesis alternativa sería que no es 50.
Si, después de realizar la prueba de dos colas, el puntaje z cae en la región de rechazo, lo que significa que la desviación está demasiado lejos de la media deseada, es posible que se requieran ajustes en la instalación o el equipo asociado para corregir el error. El uso regular de métodos de prueba de dos colas puede ayudar a garantizar que la producción se mantenga dentro de los límites a largo plazo.
Tenga cuidado de notar si una prueba estadística es de una o dos colas, ya que esto influirá en gran medida en la interpretación de un modelo.
Prueba de dos colas vs. una cola
Cuando se configura una prueba de hipótesis para mostrar que la media de la muestra sería más alta o más baja que la media de la población, esto se denomina prueba de una cola. La prueba de una cola recibe su nombre de probar el área debajo de una de las colas (lados) de una distribución normal. Cuando se usa una prueba de una cola, un analista está probando la posibilidad de la relación en una dirección de interés y descartando por completo la posibilidad de una relación en otra dirección.
Si la muestra que se está probando cae en el área crítica unilateral, se aceptará la hipótesis alternativa en lugar de la hipótesis nula. Una prueba de una cola también se conoce como hipótesis direccional o prueba direccional.
Una prueba de dos colas, por otro lado, está diseñada para examinar ambos lados de un rango de datos específico para probar si una muestra es mayor o menor que el rango de valores.
Ejemplo de una prueba de dos colas
Como ejemplo hipotético, imagine que un nuevo corredor de bolsa,. llamado XYZ, afirma que sus tarifas de corretaje son más bajas que las de su corredor de bolsa actual, ABC) Los datos disponibles de una firma de investigación independiente indican que la media y la desviación estándar de todos los clientes del corredor ABC son $18 y $6, respectivamente.
Se toma una muestra de 100 clientes de ABC y se calculan los cargos de corretaje con las nuevas tarifas del corredor XYZ. Si la media de la muestra es de $18.75 y la desviación estándar de la muestra es de $6, ¿se puede hacer alguna inferencia sobre la diferencia en la factura de corretaje promedio entre el corredor ABC y el corredor XYZ?
H0: Hipótesis nula: media = 18
H1: Hipótesis alternativa: media <> 18 (Esto es lo que queremos probar.)
Región de rechazo: Z <= - Z2.5 y Z>=Z2.5 (suponiendo un nivel de significación del 5 %, dividido en 2,5 cada uno a cada lado).
Z = (media muestral – media) / (desviación estándar / sqrt (n.º de muestras)) = (18,75 – 18) / (6/(sqrt(100)) = 1,25
Este valor Z calculado se encuentra entre los dos límites definidos por: - Z2,5 = -1,96 y Z2,5 = 1,96.
Esto concluye que no hay evidencia suficiente para inferir que existe alguna diferencia entre las tasas de su corredor existente y el nuevo corredor. Por lo tanto, no se puede rechazar la hipótesis nula. Alternativamente, el valor p = P(Z< -1.25)+P(Z >1.25) = 2 * 0.1056 = 0.2112 = 21.12%, que es mayor que 0.05 o 5%, lleva a la misma conclusión.
Reflejos
Por convención, se utilizan pruebas de dos colas para determinar la significancia al nivel del 5 %, lo que significa que cada lado de la distribución se corta al 2,5 %.
En estadística, una prueba de dos colas es un método en el que el área crítica de una distribución es de dos colas y prueba si una muestra es mayor o menor que un rango de valores.
Se utiliza en pruebas de hipótesis nulas y pruebas de significancia estadística.
Si la muestra que se está probando cae en alguna de las áreas críticas, se acepta la hipótesis alternativa en lugar de la hipótesis nula.
PREGUNTAS MÁS FRECUENTES
¿Qué es un puntaje Z?
Una puntuación Z describe numéricamente la relación de un valor con la media de un grupo de valores y se mide en términos del número de desviaciones estándar de la media. Si una puntuación Z es 0, indica que la puntuación del punto de datos es idéntica a la puntuación media, mientras que las puntuaciones Z de 1,0 y -1,0 indicarían valores una desviación estándar por encima o por debajo de la media. En la mayoría de los grandes conjuntos de datos, el 99 % de los valores tienen una puntuación Z entre -3 y 3, lo que significa que se encuentran dentro de tres desviaciones estándar por encima y por debajo de la media.
¿Cómo se diseña una prueba de dos colas?
Una prueba de dos colas está diseñada para determinar si una afirmación es verdadera o no dado un parámetro de población. Examina ambos lados de un rango de datos especificado según lo designado por la distribución de probabilidad involucrada. Como tal, la distribución de probabilidad debería representar la probabilidad de un resultado específico basado en estándares predeterminados.
¿Cuál es la diferencia entre una prueba de dos y una cola?
Una prueba de hipótesis de dos colas está diseñada para mostrar si la media de la muestra es significativamente mayor y significativamente menor que la media de una población. La prueba de dos colas recibe su nombre de probar el área debajo de ambas colas (lados) de una distribución normal. Por otro lado, se establece una prueba de hipótesis de una cola para mostrar que la media de la muestra sería mayor o menor que la media de la población.