Distribución muestral
驴Qu茅 es una distribuci贸n de muestreo?
Una distribuci贸n de muestreo es una distribuci贸n de probabilidad de una estad铆stica obtenida de un mayor n煤mero de muestras extra铆das de una poblaci贸n espec铆fica. La distribuci贸n de muestreo de una poblaci贸n dada es la distribuci贸n de frecuencias de un rango de resultados diferentes que posiblemente podr铆an ocurrir para una estad铆stica de una poblaci贸n.
En estad铆stica,. una poblaci贸n es el grupo completo del que se extrae una muestra estad铆stica. Una poblaci贸n puede referirse a un grupo completo de personas, objetos, eventos, visitas al hospital o medidas. Por lo tanto, se puede decir que una poblaci贸n es una observaci贸n agregada de sujetos agrupados por una caracter铆stica com煤n.
- Una distribuci贸n de muestreo es una estad铆stica que se obtiene a trav茅s de un muestreo repetido de una poblaci贸n m谩s grande.
- Describe un rango de posibles resultados de una estad铆stica, como la media o la moda de alguna variable, tal como existe verdaderamente en una poblaci贸n.
- La mayor铆a de los datos analizados por los investigadores en realidad provienen de muestras y no de poblaciones.
Comprender la distribuci贸n del muestreo
Una gran cantidad de datos extra铆dos y utilizados por acad茅micos, estad铆sticos, investigadores, especialistas en marketing, analistas, etc. son en realidad muestras, no poblaciones. Una muestra es un subconjunto de una poblaci贸n. Por ejemplo, un investigador m茅dico que quisiera comparar el peso promedio de todos los beb茅s nacidos en Am茅rica del Norte entre 1995 y 2005 con el de los nacidos en Am茅rica del Sur en el mismo per铆odo de tiempo no puede, en un tiempo razonable, obtener los datos de toda la poblaci贸n de m谩s de un mill贸n de partos que ocurrieron durante el per铆odo de diez a帽os. En cambio, solo usar谩n el peso de, digamos, 100 beb茅s, en cada continente para llegar a una conclusi贸n. El peso de 200 beb茅s utilizados es la muestra y el peso promedio calculado es la media de la muestra.
Ahora suponga que en lugar de tomar solo una muestra de 100 pesos de reci茅n nacidos de cada continente, el investigador m茅dico toma muestras aleatorias repetidas de la poblaci贸n general y calcula la media de la muestra para cada grupo de muestra. Entonces, para Am茅rica del Norte, extraen datos de 100 pesos de reci茅n nacidos registrados en los EE. UU., Canad谩 y M茅xico de la siguiente manera: cuatro muestras de 100 de hospitales seleccionados en los EE. UU., cinco muestras de 70 de Canad谩 y tres registros de 150 de M茅xico, para un total de 1.200 pesos de reci茅n nacidos agrupados en 12 conjuntos. Tambi茅n recopilan una muestra de datos de 100 pesos al nacer de cada uno de los 12 pa铆ses de Am茅rica del Sur.
Cada muestra tiene su propia media muestral y la distribuci贸n de las medias muestrales se conoce como distribuci贸n muestral.
El peso promedio calculado para cada conjunto de muestras es la distribuci贸n muestral de la media. No solo se puede calcular la media a partir de una muestra. Otras estad铆sticas,. como la desviaci贸n est谩ndar, la varianza, la proporci贸n y el rango, se pueden calcular a partir de datos de muestra. La desviaci贸n est谩ndar y la varianza miden la variabilidad de la distribuci贸n muestral.
El n煤mero de observaciones en una poblaci贸n, el n煤mero de observaciones en una muestra y el procedimiento utilizado para dibujar los conjuntos de muestras determinan la variabilidad de una distribuci贸n de muestreo. La desviaci贸n est谩ndar de una distribuci贸n de muestreo se llama error est谩ndar. Mientras que la media de una distribuci贸n muestral es igual a la media de la poblaci贸n, el error est谩ndar depende de la desviaci贸n est谩ndar de la poblaci贸n, el tama帽o de la poblaci贸n y el tama帽o de la muestra.
Saber qu茅 tan separadas est谩n la media de cada uno de los conjuntos de muestras entre s铆 y de la media de la poblaci贸n dar谩 una indicaci贸n de qu茅 tan cerca est谩 la media de la muestra de la media de la poblaci贸n. El error est谩ndar de la distribuci贸n muestral disminuye a medida que aumenta el tama帽o de la muestra.
Consideraciones Especiales
Una poblaci贸n o un conjunto de n煤meros de muestra tendr谩 una distribuci贸n normal. Sin embargo, debido a que una distribuci贸n de muestreo incluye m煤ltiples conjuntos de observaciones, no necesariamente tendr谩 una forma de campana.
Siguiendo nuestro ejemplo, el peso promedio de la poblaci贸n de los beb茅s en Am茅rica del Norte y Am茅rica del Sur tiene una distribuci贸n normal porque algunos beb茅s tendr谩n bajo peso (por debajo de la media) o sobrepeso (por encima de la media), y la mayor铆a de los beb茅s estar谩n en el medio (alrededor de la media). ). Si el peso promedio de los reci茅n nacidos en Am茅rica del Norte es de siete libras, el peso medio de la muestra en cada uno de los 12 conjuntos de observaciones de la muestra registradas para Am茅rica del Norte tambi茅n estar谩 cerca de las siete libras.
Sin embargo, si grafica cada uno de los promedios calculados en cada uno de los 1200 grupos de muestra, la forma resultante puede resultar en una distribuci贸n uniforme, pero es dif铆cil predecir con certeza cu谩l ser谩 la forma real. Cuantas m谩s muestras utilice el investigador de la poblaci贸n de m谩s de un mill贸n de cifras de peso, m谩s comenzar谩 a formar el gr谩fico una distribuci贸n normal.