Teorema del límite central (CLT)
¿Qué es el teorema del límite central (CLT)?
En la teoría de la probabilidad, el teorema del límite central (CLT) establece que la distribución de una variable de muestra se aproxima a una distribución normal (es decir, una "curva de campana") a medida que el tamaño de la muestra aumenta, suponiendo que todas las muestras son de tamaño idéntico e independientemente de la forma de distribución real de la población.
Dicho de otra manera, CLT es una premisa estadística de que, dado un tamaño de muestra suficientemente grande de una población con un nivel finito de varianza, la media de todas las variables muestreadas de la misma población será aproximadamente igual a la media de toda la población. Además, estas muestras se aproximan a una distribución normal,. siendo sus varianzas aproximadamente iguales a la varianza de la población a medida que aumenta el tamaño de la muestra, de acuerdo con la ley de los grandes números.
Aunque este concepto fue desarrollado por primera vez por Abraham de Moivre en 1733, no se formalizó hasta 1930, cuando el célebre matemático húngaro George Pólya lo denominó teorema del límite central.
Comprender el teorema del límite central (CLT)
De acuerdo con el teorema del límite central, la media de una muestra de datos estará más cerca de la media de la población general en cuestión, a medida que aumenta el tamaño de la muestra, independientemente de la distribución real de los datos. En otras palabras, los datos son precisos ya sea que la distribución sea normal o aberrante.
Como regla general, los tamaños de muestra de alrededor de 30-50 se consideran suficientes para que la CLT se mantenga, lo que significa que la distribución de las medias de la muestra se distribuye de manera bastante normal. Por lo tanto, cuantas más muestras se toman, más los resultados graficados toman la forma de una distribución normal. Tenga en cuenta, sin embargo, que el teorema del límite central aún se aproximará en muchos casos para tamaños de muestra mucho más pequeños, como n = 8 o n = 5.
El teorema del límite central a menudo se usa junto con la ley de los grandes números, que establece que el promedio de las medias muestrales y las desviaciones estándar se acercarán más a igualar la media poblacional y la desviación estándar a medida que crece el tamaño de la muestra, lo cual es extremadamente útil en predecir con precisión las características de las poblaciones.
Componentes clave del teorema del límite central
El teorema del límite central se compone de varias características clave. Estas características giran en gran medida en torno a las muestras, los tamaños de las muestras y la población de datos.
El muestreo es sucesivo. Esto significa que algunas unidades de muestra son comunes con unidades de muestra seleccionadas en ocasiones anteriores.
El muestreo es aleatorio. Todas las muestras deben ser seleccionadas al azar para que tengan la misma posibilidad estadística de ser seleccionadas.
Las muestras deben ser independientes. Las selecciones o los resultados de una muestra no deben afectar las muestras futuras ni los resultados de otras muestras.
Las muestras deben ser limitadas. A menudo se cita que una muestra no debe ser más del 10 % de una población si el muestreo se realiza sin reemplazo. En general, los tamaños de población más grandes justifican el uso de tamaños de muestra más grandes.
El tamaño de la muestra está aumentando. El teorema del límite central es relevante a medida que se seleccionan más muestras.
El Teorema del Límite Central en Finanzas
El CLT es útil cuando se examinan los rendimientos de una acción individual o índices más amplios, porque el análisis es simple, debido a la relativa facilidad para generar los datos financieros necesarios. En consecuencia, los inversores de todo tipo confían en el CLT para analizar los rendimientos de las acciones, crear carteras y gestionar el riesgo.
Digamos, por ejemplo, que un inversor desea analizar el rendimiento general de un índice bursátil que comprende 1000 acciones. En este escenario, ese inversionista puede simplemente estudiar una muestra aleatoria de acciones para cultivar rendimientos estimados del índice total. Para estar seguro, se deben muestrear al menos 30-50 acciones seleccionadas al azar en varios sectores para que se cumpla el teorema del límite central. Además, las acciones previamente seleccionadas deben intercambiarse con diferentes nombres para ayudar a eliminar el sesgo.
Reflejos
El teorema del límite central (CLT) establece que la distribución de las medias muestrales se aproxima a una distribución normal a medida que aumenta el tamaño de la muestra, independientemente de la distribución de la población.
Los tamaños de muestra iguales o superiores a 30 a menudo se consideran suficientes para que el CLT se mantenga.
Un aspecto clave de CLT es que el promedio de las medias y las desviaciones estándar de la muestra será igual a la media y la desviación estándar de la población.
Un tamaño de muestra suficientemente grande puede predecir con mayor precisión las características de una población.
CLT es útil en finanzas cuando se analiza una gran colección de valores para estimar distribuciones de cartera y características de rendimiento, riesgo y correlación.
PREGUNTAS MÁS FRECUENTES
¿Por qué es útil el teorema del límite central?
El teorema del límite central es útil cuando se analizan grandes conjuntos de datos porque permite suponer que la distribución muestral de la media se distribuirá normalmente en la mayoría de los casos. Esto permite un análisis estadístico y una inferencia más fáciles. Por ejemplo, los inversores pueden utilizar el teorema del límite central para agregar datos de rendimiento de valores individuales y generar una distribución de medias de muestra que represente una distribución de población más grande para los rendimientos de valores durante un período de tiempo.
¿Cuál es la fórmula del teorema del límite central?
El teorema del límite central no tiene su propia fórmula, pero se basa en la media muestral y la desviación estándar. A medida que se recopilan las medias de la muestra de la población, se utiliza la desviación estándar para distribuir los datos a lo largo de una curva de distribución de probabilidad.
¿Por qué el tamaño de muestra mínimo del teorema del límite central es 30?
Un tamaño de muestra de 30 es bastante común en todas las estadísticas. Un tamaño de muestra de 30 a menudo aumenta el intervalo de confianza de su conjunto de datos de población lo suficiente como para garantizar afirmaciones contra sus hallazgos. Cuanto mayor sea el tamaño de su muestra, más probable será que la muestra sea representativa de su conjunto de población.