Estadísticas

¿Qué es la estadística?

La estadística es una rama de las matemáticas aplicadas que implica la recopilación, descripción, análisis e inferencia de conclusiones a partir de datos cuantitativos. Las teorías matemáticas detrás de las estadísticas se basan en gran medida en el cálculo diferencial e integral, el álgebra lineal y la teoría de la probabilidad.

Los estadísticos, las personas que hacen estadísticas, están particularmente interesados en determinar cómo sacar conclusiones confiables sobre grupos grandes y eventos generales a partir del comportamiento y otras características observables de muestras pequeñas. Estas pequeñas muestras representan una parte del grupo grande o un número limitado de instancias de un fenómeno general.

Comprender las estadísticas

Las estadísticas se utilizan en prácticamente todas las disciplinas científicas, como las ciencias físicas y sociales, así como en los negocios, las humanidades, el gobierno y la fabricación. La estadística es fundamentalmente una rama de las matemáticas aplicadas que se desarrolló a partir de la aplicación de herramientas matemáticas que incluyen el cálculo y el álgebra lineal a la teoría de la probabilidad.

En la práctica, la estadística es la idea de que podemos aprender sobre las propiedades de grandes conjuntos de objetos o eventos (una población ) al estudiar las características de un número menor de objetos o eventos similares (una muestra ). Debido a que en muchos casos la recopilación de datos completos sobre una población completa es demasiado costosa, difícil o completamente imposible, las estadísticas comienzan con una muestra que se puede observar de manera conveniente o económica.

Se utilizan dos tipos de métodos estadísticos para analizar datos: estadísticas descriptivas y estadísticas inferenciales. Los estadísticos miden y recopilan datos sobre los individuos o elementos de una muestra, luego analizan estos datos para generar estadísticas descriptivas. Luego pueden usar estas características observadas de los datos de la muestra, que se denominan correctamente "estadísticas", para hacer inferencias o conjeturas informadas sobre las características no medidas (o no medidas) de la población más amplia, conocidas como parámetros.

Las estadísticas se remontan informalmente a siglos. Un registro temprano de correspondencia entre los matemáticos franceses Pierre de Fermat y Blaise Pascal en 1654 se cita a menudo como un ejemplo temprano de análisis de probabilidad estadística.

Estadísticas descriptivas e inferenciales

Las dos áreas principales de la estadística se conocen como estadística descriptiva, que describe las propiedades de los datos de muestra y población, y estadística inferencial, que utiliza esas propiedades para probar hipótesis y sacar conclusiones. Las estadísticas descriptivas incluyen la media (promedio), la varianza, la asimetría y la curtosis. Las estadísticas inferenciales incluyen análisis de regresión lineal,. análisis de varianza (ANOVA), modelos logit/Probit y pruebas de hipótesis nula.

Estadísticas descriptivas

Las estadísticas descriptivas se centran principalmente en la tendencia central, la variabilidad y la distribución de los datos de la muestra. Tendencia central significa la estimación de las características, un elemento típico de una muestra o población, e incluye estadísticas descriptivas como la media,. la mediana y la moda. La variabilidad se refiere a un conjunto de estadísticas que muestran cuánta diferencia hay entre los elementos de una muestra o población a lo largo de las características medidas, e incluye métricas como el rango,. la varianza y la desviación estándar.

La distribución se refiere a la "forma" general de los datos, que se puede representar en un gráfico como un histograma o un gráfico de puntos, e incluye propiedades como la función de distribución de probabilidad, la asimetría y la curtosis. Las estadísticas descriptivas también pueden describir las diferencias entre las características observadas de los elementos de un conjunto de datos. Las estadísticas descriptivas nos ayudan a comprender las propiedades colectivas de los elementos de una muestra de datos y forman la base para probar hipótesis y hacer predicciones utilizando estadísticas inferenciales.

Estadística inferencial

Las estadísticas inferenciales son herramientas que los estadísticos utilizan para sacar conclusiones sobre las características de una población, extraídas de las características de una muestra, y para decidir qué tan seguros pueden estar de la confiabilidad de esas conclusiones. Con base en el tamaño y la distribución de la muestra, los estadísticos pueden calcular la probabilidad de que las estadísticas, que miden la tendencia central, la variabilidad, la distribución y las relaciones entre las características dentro de una muestra de datos, brinden una imagen precisa de los parámetros correspondientes de toda la población de la que procede la muestra. es dibujado.

Las estadísticas inferenciales se utilizan para hacer generalizaciones sobre grandes grupos, como estimar la demanda promedio de un producto encuestando una muestra de los hábitos de compra de los consumidores o para intentar predecir eventos futuros, como proyectar el rendimiento futuro de una clase de valor o activo con base en retornos en un período de muestra.

regresión es una técnica de inferencia estadística ampliamente utilizada para determinar la fuerza y la naturaleza de la relación (es decir, la correlación ) entre una variable dependiente y una o más variables explicativas (independientes). El resultado de un modelo de regresión a menudo se analiza en busca de significación estadística,. lo que se refiere a la afirmación de que un resultado de los hallazgos generados por pruebas o experimentación no es probable que haya ocurrido al azar o por casualidad, sino que es probable que sea atribuible a una causa específica aclarada por los datos. Tener significación estadística es importante para las disciplinas académicas o los profesionales que dependen en gran medida del análisis de datos y la investigación.

Comprender los datos estadísticos

La raíz de las estadísticas está impulsada por variables. Una variable es un conjunto de datos que se puede contar y que marca una característica o atributo de un artículo. Por ejemplo, un automóvil puede tener variables como marca, modelo, año, millaje, color o condición. Al combinar las variables en un conjunto de datos (es decir, los colores de todos los automóviles en un estacionamiento determinado), las estadísticas nos permiten comprender mejor las tendencias y los resultados.

Hay dos tipos principales de variables. Primero, las variables cualitativas son atributos específicos que a menudo no son numéricos. Muchos de los ejemplos dados en el ejemplo del automóvil son cualitativos. Otros ejemplos de variables cualitativas en estadística son el género, el color de ojos o la ciudad de nacimiento. Los datos cualitativos se usan con mayor frecuencia para determinar qué porcentaje de un resultado ocurre para cualquier variable cualitativa dada, y el análisis cualitativo a menudo no se basa en números. Por ejemplo, tratar de determinar qué porcentaje de mujeres son propietarias de un negocio analiza datos cualitativos.

El segundo tipo de variable en estadística son las variables cuantitativas. Las variables cuantitativas se estudian numéricamente y sólo tienen peso cuando se trata de un descriptor no numérico. Similar al análisis cuantitativo,. esta información se basa en números. En el ejemplo de automóvil anterior, el kilometraje recorrido es una variable cuantitativa. Sin embargo, el número 60,000 no tiene valor a menos que se entienda que es el número total de millas recorridas.

Las variables cuantitativas se pueden dividir en dos categorías. Primero, las variables discretas tienen limitaciones en las estadísticas e infieren que hay brechas entre los posibles valores de las variables discretas. La cantidad de puntos anotados en un partido de fútbol es una variable discreta porque (1) no puede haber decimales y (2) es imposible que un equipo anote solo 1 punto.

En segundo lugar, la estadística también hace uso de variables cuantitativas continuas. Estos valores se ejecutan a lo largo de una escala; mientras que los valores discretos tienen limitaciones, las variables continuas a menudo se miden en decimales. Al medir la altura de los jugadores de fútbol, se puede obtener cualquier valor (dentro de los límites posibles), y las alturas se pueden medir hasta 1/16 de pulgada, si no más.

Los estadísticos pueden tener diferentes títulos y puestos dentro de una empresa. Según Glassdoor, la compensación total promedio para un estadístico a diciembre de 2021 fue de $98,034. Un rol igualmente analítico de científico de datos produjo una compensación anual de casi $119,000.

Niveles estadísticos de medición

Después de analizar las variables y los resultados como parte de las estadísticas, existen varios niveles de medición resultantes. Las estadísticas pueden cuantificar los resultados de estas diferentes maneras:

Medición de nivel nominal. No hay valor numérico o cuantitativo, y las calidades no están clasificadas. En cambio, las mediciones de nivel nominal son simplemente etiquetas o categorías asignadas a otras variables. Es más fácil pensar en las mediciones de nivel nominal como hechos no numéricos sobre una variable. Ejemplo: El nombre del presidente electo en 2020 fue Joseph Robinette Biden, Jr.
Medición de nivel ordinal: Los resultados se pueden organizar en un orden, sin embargo, todos los valores de datos tienen el mismo valor o peso. Aunque las mediciones numéricas de nivel ordinal en las estadísticas no se pueden restar entre sí, ya que solo importa la posición del punto de datos. A menudo incorporados en estadísticas no paramétricas,. los niveles ordinales a menudo se comparan con el grupo variable total. Ejemplo: el estadounidense Fred Kerley fue el segundo hombre más rápido en los Juegos Olímpicos de Tokio 2020 según tiempos de sprint de 100 metros.
Medición del nivel de intervalo: Los resultados se pueden organizar en orden; sin embargo, las diferencias entre los valores de los datos ahora pueden tener significado. A menudo se utilizan dos puntos de datos diferentes para comparar el paso del tiempo o las condiciones cambiantes dentro de un conjunto de datos. A menudo no hay un "punto de partida" para el rango de valores de datos, y las fechas o temperaturas del calendario pueden no tener un valor cero intrínseco significativo. Ejemplo: la inflación alcanzó el 8,6 % en mayo de 2022. La última vez que la inflación fue tan alta fue en diciembre de 1981.
Medición de nivel de relación: Los resultados se pueden organizar en orden, y las diferencias entre los valores de los datos ahora tienen significado. Sin embargo, ahora hay un punto de partida o "valor cero" que se puede usar para proporcionar más valor a un valor estadístico. La relación entre los valores de los datos ahora tiene significado, incluida su distancia desde cero. Ejemplo: La temperatura meteorológica más baja registrada fue de -128,6 grados Fahrenheit en la Antártida.

Técnicas de muestreo estadístico

Para recopilar información estadística, a menudo no sería posible recopilar datos de todos los puntos de datos dentro de una población. En cambio, las estadísticas se basan en diferentes técnicas de muestreo para crear un subconjunto representativo de la población que sea más fácil de analizar. En estadística, hay varios tipos primarios de muestreo.

El muestreo aleatorio simple exige que todos los miembros de la población tengan las mismas posibilidades de ser seleccionados para el análisis. Toda la población se utiliza como base para el muestreo, y cualquier generador aleatorio basado en el azar puede seleccionar los elementos de la muestra. Por ejemplo, se alinean 100 individuos y se eligen 10 al azar.
El muestreo sistemático también requiere una muestra aleatoria. Sin embargo, su técnica se modifica ligeramente para que sea más fácil de realizar. Se genera un solo número aleatorio y luego se seleccionan los individuos en un intervalo regular específico hasta que se completa el tamaño de la muestra. Por ejemplo, 100 individuos están alineados y numerados. El séptimo individuo se selecciona para la muestra seguido de cada noveno individuo subsiguiente hasta que se hayan seleccionado 10 elementos de muestra.
El muestreo estratificado requiere más control sobre su muestra. La población se divide en subgrupos basados en características similares. Luego, calcula cuántas personas de cada subgrupo representarían a la población total. Por ejemplo, 100 personas se agrupan por género y raza. Luego, se tomará una muestra de cada subgrupo en la proporción de qué tan representativo es ese subgrupo de la población.
El muestreo por conglomerados también requiere subgrupos. Sin embargo, cada subgrupo debe ser representativo de la población. En lugar de seleccionar individuos al azar dentro de un subgrupo, todo el subgrupo se selecciona al azar.

¿No está seguro de qué jugador de las Grandes Ligas de Béisbol debería haber ganado el premio al Jugador Más Valioso el año pasado? Las estadísticas, que a menudo se utilizan para determinar el valor, se citan a menudo cuando se otorga el premio al mejor jugador. Las estadísticas pueden incluir promedio de bateo, número de jonrones y bases robadas.

Ejemplos de estadísticas

Las estadísticas ocupan un lugar destacado en las finanzas, las inversiones, los negocios y el mundo. Gran parte de la información que ve y los datos que recibe se derivan de las estadísticas, que se utilizan en todas las facetas de un negocio.

En inversión, las estadísticas incluyen el volumen comercial promedio, mínimo de 52 semanas, máximo de 52 semanas, beta y correlación entre clases de activos o valores.
En economía, las estadísticas incluyen el PIB, el desempleo, los precios al consumidor, la inflación y otras métricas de crecimiento económico
En marketing, las estadísticas incluyen tasas de conversión, tasas de clics, cantidades de búsqueda y métricas de redes sociales.
En contabilidad, las estadísticas incluyen métricas de liquidez, solvencia y rentabilidad a lo largo del tiempo.
En tecnología de la información, las estadísticas incluyen ancho de banda, capacidades de red y logística de hardware.
En recursos humanos,. las estadísticas incluyen la rotación de empleados, la satisfacción de los empleados y la compensación promedio en relación con el mercado.

Reflejos

Se pueden utilizar varias técnicas de muestreo para recopilar datos estadísticos, incluido el muestreo aleatorio simple, sistemático, estratificado o por conglomerados.
Las estadísticas se pueden comunicar en diferentes niveles, desde descriptores no numéricos (nivel nominal) hasta numéricos en referencia a un punto cero (nivel de relación).
Las estadísticas están presentes en casi todos los departamentos de todas las empresas y también son una parte integral de la inversión.
La estadística es el estudio y la manipulación de datos, incluidas las formas de recopilar, revisar, analizar y sacar conclusiones de los datos.
Las dos áreas principales de la estadística son la estadística descriptiva y la inferencial.

PREGUNTAS MÁS FRECUENTES

¿Cuál es la diferencia entre estadística descriptiva e inferencial?

Las estadísticas descriptivas se utilizan para describir o resumir las características de una muestra o conjunto de datos, como la media, la desviación estándar o la frecuencia de una variable. La estadística inferencial, por el contrario, emplea cualquier número de técnicas para relacionar las variables en un conjunto de datos entre sí, por ejemplo, utilizando análisis de correlación o regresión. Estos se pueden usar para estimar pronósticos o inferir causalidad.

¿Por qué son importantes las estadísticas?

Las estadísticas proporcionan la información para educar cómo funcionan las cosas. Las estadísticas se utilizan para realizar investigaciones, evaluar resultados, desarrollar el pensamiento crítico y tomar decisiones informadas. Las estadísticas se pueden utilizar para investigar casi cualquier campo de estudio para investigar por qué suceden las cosas, cuándo ocurren y si su recurrencia es predecible.

¿Quién usa las estadísticas?

Las estadísticas se utilizan ampliamente en una variedad de aplicaciones y profesiones. Cada vez que se recopilan y analizan datos, se realizan estadísticas. Esto puede variar desde agencias gubernamentales hasta investigaciones académicas y análisis de inversiones.

¿Cómo se utilizan las estadísticas en economía y finanzas?

Los economistas recopilan y analizan todo tipo de datos, desde el gasto del consumidor hasta los inicios de viviendas, la inflación y el crecimiento del PIB. En finanzas, los analistas e inversores recopilan datos sobre empresas, industrias, sentimiento y datos de mercado sobre precio y volumen. En conjunto, el uso de estadísticas inferenciales en estos campos se conoce como econometría. Varios modelos financieros importantes, desde CAPM hasta la teoría moderna de carteras (MPT) y el modelo de valoración de opciones de Black-Scholes , se basan en la inferencia estadística.