Investor's wiki

Bondad de ajuste

Bondad de ajuste

¿Qué es la bondad de ajuste?

El término bondad de ajuste se refiere a una prueba estadística que determina qué tan bien se ajustan los datos de una muestra a una distribución de una población con una distribución normal. En pocas palabras, plantea la hipótesis de si una muestra está sesgada o representa los datos que esperaría encontrar en la población real.

La bondad de ajuste establece la discrepancia entre los valores observados y los esperados del modelo en un caso de distribución normal. Existen múltiples métodos para determinar la bondad de ajuste, incluido el chi-cuadrado.

Comprender la bondad de ajuste

Las pruebas de bondad de ajuste son métodos estadísticos que hacen inferencias sobre los valores observados. Por ejemplo, puede determinar si un grupo de muestra es realmente representativo de toda la población. Como tales, determinan cómo se relacionan los valores reales con los valores predichos en un modelo. Cuando se utilizan en la toma de decisiones, las pruebas de bondad de ajuste facilitan la predicción de tendencias y patrones en el futuro.

Como se señaló anteriormente, existen varios tipos de pruebas de bondad de ajuste. Incluyen la prueba de chi-cuadrado, que es la más común, así como la prueba de Kolmogorov-Smirnov y la prueba de Shipiro-Wilk. Las pruebas se realizan normalmente utilizando software de computadora. Pero los estadísticos pueden hacer estas pruebas utilizando fórmulas que se adaptan al tipo específico de prueba.

Para realizar la prueba, necesita una determinada variable, junto con una suposición de cómo se distribuye. También necesita un conjunto de datos con valores claros y explícitos, como:

  • Los valores observados, que se derivan del conjunto de datos reales

  • Los valores esperados, que se toman de las suposiciones realizadas

  • El número total de categorías en el conjunto

Las pruebas de bondad de ajuste se usan comúnmente para probar la normalidad de los residuos o para determinar si dos muestras se obtienen de distribuciones idénticas.

Consideraciones Especiales

Para interpretar una prueba de bondad de ajuste, es importante que los estadísticos establezcan un nivel alfa, como el valor p para la prueba de chi-cuadrado. El valor p se refiere a la probabilidad de obtener resultados cercanos a los extremos de los resultados observados. Esto supone que la hipótesis nula es correcta. Una hipótesis nula afirma que no existe una relación entre las variables, y la hipótesis alternativa asume que existe una relación.

En cambio, la frecuencia de los valores observados se mide y posteriormente se usa con los valores esperados y los grados de libertad para calcular el chi-cuadrado. Si el resultado es más bajo que alfa, la hipótesis nula no es válida, lo que indica que existe una relación entre las variables.

Tipos de pruebas de bondad de ajuste

Prueba de chi-cuadrado

<semántica>< mi>χ2=i< mo>=1k( OiEi)2/E i<codificación de anotaciones="aplicación/x-tex">\chi2=\sum\limitsk_(O_i-E_i)^ 2/E_i</anotación></semántica></matemáticas>

La prueba de chi-cuadrado,. también conocida como prueba de independencia de chi-cuadrado, es un método de estadística inferencial que prueba la validez de una afirmación hecha sobre una población basada en una muestra aleatoria.

Utilizado exclusivamente para datos separados en clases (contenedores), requiere un tamaño de muestra suficiente para producir resultados precisos. Pero no indica el tipo o la intensidad de la relación. Por ejemplo, no concluye si la relación es positiva o negativa.

Para calcular la bondad de ajuste de chi-cuadrado, establezca el nivel de significación alfa deseado. Entonces, si su nivel de confianza es del 95 % (o 0,95), entonces el alfa es 0,05. Luego, identifique las variables categóricas para probar, luego defina declaraciones de hipótesis sobre las relaciones entre ellas.

Las variables deben ser mutuamente excluyentes para calificar para la prueba de independencia de chi-cuadrado. Y la prueba de bondad de ajuste chi no debe usarse para datos que son continuos.

Prueba de Kolmogorov-Smirnov

<semántica>D =max1< mo>≤iN(</ mo>F(Yi)i1N,iN< mo>−F(Yi))<anotación codificación="aplicación/x-tex">D=\max\limits_{ 1\leq i\leq N}\bigg(F(Y_i)-\frac,\frac-F(Y_i)\bigg)</semántica ></matemáticas>(F(Y i</ span>)< span class="vlist" style="height:0.855664em;">< abarcan clase="restablecimiento de tamaño-tamaño6 tamaño3 mtight">Ni1 ,< span style="top:-2.6550000000000002em;">NiF( Yi< /span>))

Nombrada en honor a los matemáticos rusos Andrey Kolmogorov y Nikolai Smirnov, la prueba Kolmogorov-Smirnov (también conocida como prueba KS) es un método estadístico que determina si una muestra proviene de una distribución específica dentro de una población.

Esta prueba, que se recomienda para muestras grandes (p. ej., más de 2000), no es paramétrica. Eso significa que no depende de ninguna distribución para ser válido. El objetivo es probar la hipótesis nula, que es la muestra de la distribución normal.

Al igual que chi-cuadrado, utiliza una hipótesis nula y alternativa y un nivel alfa de significancia. Nulo indica que los datos siguen una distribución específica dentro de la población, y alternativa indica que los datos no siguieron una distribución específica dentro de la población. El alfa se utiliza para determinar el valor crítico utilizado en la prueba. Pero a diferencia de la prueba de chi-cuadrado, la prueba de Kolmogorov-Smirnov se aplica a distribuciones continuas.

La estadística de prueba calculada a menudo se denota como D. Determina si la hipótesis nula se acepta o se rechaza. Si D es mayor que el valor crítico en alfa,. se rechaza la hipótesis nula. Si D es menor que el valor crítico, se acepta la hipótesis nula.

Prueba de Shipiro-Wilk

<semántica>W =(i< /mi>=1nai (x(i))2i=1 n(xi</ msub>xˉ) 2,<anotación codificación="aplicación/x- tex">W=\frac{\big(\sum^n_a_i(x_{(i)}\big)2}{\sumn_(x_i-\bar)^2},</anotación></semántica></matemáticas>< abarcan clase="mord">i=1n< /span>(</ span>x< /span>i xˉ) 2 ( i =1<span style="top:-2.931em;margin-right:0.07142857142857144em; >n a< span class="vlist" style="height:0.3280857142857143em;">i< /span>< span>(< abarcan clase="mord mathnormal mtight">x(i ) )2,

La prueba de Shipiro-Wilk determina si una muestra sigue una distribución normal. La prueba solo verifica la normalidad cuando se usa una muestra con una variable de datos continuos y se recomienda para tamaños de muestra pequeños hasta 2000.

La prueba de Shipiro-Wilk utiliza una gráfica de probabilidad llamada Gráfica QQ, que muestra dos conjuntos de cuantiles en el eje y que están ordenados de menor a mayor. Si cada cuantil provino de la misma distribución, la serie de gráficos es lineal.

El gráfico QQ se utiliza para estimar la varianza. Utilizando la varianza QQ Plot junto con la varianza estimada de la población, se puede determinar si la muestra pertenece a una distribución normal. Si el cociente de ambas varianzas es igual o cercano a 1, se puede aceptar la hipótesis nula. Si es considerablemente inferior a 1, puede rechazarse.

Al igual que las pruebas mencionadas anteriormente, esta utiliza alfa y forma dos hipótesis: nula y alternativa. La hipótesis nula establece que la muestra proviene de la distribución normal, mientras que la hipótesis alternativa establece que la muestra no proviene de la distribución normal.

Ejemplo de bondad de ajuste

Aquí hay un ejemplo hipotético para mostrar cómo funciona la prueba de bondad de ajuste.

Suponga que un pequeño gimnasio comunitario opera bajo el supuesto de que la asistencia más alta es los lunes, martes y sábados, la asistencia promedio los miércoles y jueves, y la asistencia más baja los viernes y domingos. Con base en estas suposiciones, el gimnasio emplea una cierta cantidad de miembros del personal todos los días para registrar a los miembros, limpiar las instalaciones, ofrecer servicios de capacitación e impartir clases.

Pero el gimnasio no está funcionando bien económicamente y el propietario quiere saber si estas suposiciones de asistencia y los niveles de personal son correctos. El propietario decide contar el número de asistentes al gimnasio cada día durante seis semanas. Luego pueden comparar la asistencia supuesta del gimnasio con su asistencia observada mediante una prueba de bondad de ajuste de chi-cuadrado, por ejemplo.

Ahora que tienen los nuevos datos, pueden determinar cómo administrar mejor el gimnasio y mejorar la rentabilidad.

La línea de fondo

Las pruebas de bondad de ajuste determinan qué tan bien los datos de la muestra se ajustan a lo que se espera de una población. A partir de los datos de la muestra, se recopila un valor observado y se compara con el valor esperado calculado utilizando una medida de discrepancia. Hay diferentes pruebas de hipótesis de bondad de ajuste disponibles según el resultado que esté buscando.

La elección de la prueba de bondad de ajuste adecuada depende en gran medida de lo que desee saber sobre una muestra y de su tamaño. Por ejemplo, si desea saber si los valores observados para los datos categóricos coinciden con los valores esperados para los datos categóricos, use chi-cuadrado. Si desea saber si una pequeña muestra sigue una distribución normal, la prueba de Shipiro-Wilk podría ser ventajosa. Hay muchas pruebas disponibles para determinar la bondad de ajuste.

Reflejos

  • Una bondad de ajuste es una prueba estadística que trata de determinar si un conjunto de valores observados coinciden con los esperados bajo el modelo aplicable.

  • Pueden mostrarle si los datos de su muestra se ajustan a un conjunto esperado de datos de una población con distribución normal.

  • La prueba de chi-cuadrado determina si existe una relación entre los datos categóricos.

  • Existen múltiples tipos de pruebas de bondad de ajuste, pero la más común es la prueba de chi-cuadrado.

  • La prueba de Kolmogorov-Smirnov determina si una muestra proviene de una distribución específica de una población.

PREGUNTAS MÁS FRECUENTES

¿Qué es la bondad de ajuste en la prueba de chi-cuadrado?

El chi-cuadrado prueba si existen relaciones entre las variables categóricas y si la muestra representa el todo. Estima qué tan cerca los datos observados reflejan los datos esperados, o qué tan bien se ajustan.

¿Qué significa bondad de ajuste?

La bondad de ajuste es una prueba de hipótesis estadística que se utiliza para ver con qué precisión los datos observados reflejan los datos esperados. Las pruebas de bondad de ajuste pueden ayudar a determinar si una muestra sigue una distribución normal, si las variables categóricas están relacionadas o si las muestras aleatorias pertenecen a la misma distribución.

¿Cómo se hace la prueba de bondad de ajuste?

La prueba de bondad de ajuste consta de diferentes métodos de prueba. El objetivo de la prueba ayudará a determinar qué método usar. Por ejemplo, si el objetivo es probar la normalidad en una muestra relativamente pequeña, la prueba de Shipiro-Wilk puede ser adecuada. Si se quiere determinar si una muestra proviene de una distribución específica dentro de una población, se utilizará la prueba de Kolmogorov-Smirnov. Cada prueba utiliza su propia fórmula única. Sin embargo, tienen puntos en común, como una hipótesis nula y un nivel de significancia.

¿Por qué es importante la bondad de ajuste?

Las pruebas de bondad de ajuste ayudan a determinar si los datos observados se alinean con lo esperado. Se pueden tomar decisiones basadas en el resultado de la prueba de hipótesis realizada. Por ejemplo, un minorista quiere saber qué oferta de productos atrae a los jóvenes. El minorista encuesta a una muestra aleatoria de personas mayores y jóvenes para identificar qué producto prefiere. Usando chi-cuadrado, identifican que, con un 95% de confianza, existe una relación entre el producto A y los jóvenes. Con base en estos resultados, se pudo determinar que esta muestra representa a la población de adultos jóvenes. Los comerciantes minoristas pueden usar esto para reformar sus campañas.