Regresión lineal múltiple (MLR)

¿Qué es la regresión lineal múltiple (MLR)?

La regresión lineal múltiple (MLR), también conocida simplemente como regresión múltiple, es una técnica estadística que utiliza varias variables explicativas para predecir el resultado de una variable de respuesta. El objetivo de la regresión lineal múltiple es modelar la relación lineal entre las variables explicativas (independientes) y las variables de respuesta (dependientes). En esencia, la regresión múltiple es la extensión de la regresión de mínimos cuadrados ordinarios (OLS) porque involucra más de una variable explicativa.

Fórmula y Cálculo de Regresión Lineal Múltiple

$<codificación de anotación="aplicación/x-tex">\begin&y_i = \beta_0 + \beta$

Qué puede decirle la regresión lineal múltiple

La regresión lineal simple es una función que permite a un analista o estadístico hacer predicciones sobre una variable en función de la información que se conoce sobre otra variable. La regresión lineal solo se puede usar cuando uno tiene dos variables continuas: una variable independiente y una variable dependiente. La variable independiente es el parámetro que se utiliza para calcular la variable dependiente o el resultado. Un modelo de regresión múltiple se extiende a varias variables explicativas.

El modelo de regresión múltiple se basa en los siguientes supuestos:

Existe una relación lineal entre las variables dependientes y las variables independientes
Las variables independientes no están demasiado correlacionadas entre sí
y_i las observaciones se seleccionan de forma independiente y aleatoria de la población
Los residuos deben tener una distribución normal con media 0 y varianza σ

El coeficiente de determinación (R-cuadrado) es una métrica estadística que se usa para medir qué parte de la variación en el resultado puede explicarse por la variación en las variables independientes. R² siempre aumenta a medida que se agregan más predictores al modelo MLR, aunque es posible que los predictores no estén relacionados con la variable de resultado.

R² por sí solo no se puede usar para identificar qué predictores deben incluirse en un modelo y cuáles deben excluirse. R² solo puede estar entre 0 y 1, donde 0 indica que ninguna de las variables independientes puede predecir el resultado y 1 indica que el resultado se puede predecir sin error a partir de las variables independientes.

Al interpretar los resultados de la regresión múltiple, los coeficientes beta son válidos mientras se mantienen constantes todas las demás variables ("todo lo demás igual"). El resultado de una regresión múltiple se puede mostrar horizontalmente como una ecuación o verticalmente en forma de tabla.

Ejemplo de cómo utilizar la regresión lineal múltiple

Como ejemplo, un analista puede querer saber cómo el movimiento del mercado afecta el precio de ExxonMobil (XOM). En este caso, su ecuación lineal tendrá el valor del índice S&P 500 como variable independiente, o predictor, y el precio de XOM como variable dependiente.

En realidad, múltiples factores predicen el resultado de un evento. El movimiento de precios de ExxonMobil, por ejemplo, depende de algo más que el desempeño del mercado en general. Otros predictores, como el precio del petróleo, las tasas de interés y el movimiento del precio de los futuros del petróleo, pueden afectar el precio de XOM y los precios de las acciones de otras compañías petroleras. Para comprender una relación en la que están presentes más de dos variables, se utiliza la regresión lineal múltiple.

La regresión lineal múltiple (MLR) se utiliza para determinar una relación matemática entre varias variables aleatorias. En otros términos, MLR examina cómo múltiples variables independientes se relacionan con una variable dependiente. Una vez que se ha determinado cada uno de los factores independientes para predecir la variable dependiente, la información sobre las múltiples variables se puede utilizar para crear una predicción precisa sobre el nivel de efecto que tienen sobre la variable de resultado. El modelo crea una relación en forma de línea recta (lineal) que se aproxima mejor a todos los puntos de datos individuales.

En referencia a la ecuación MLR anterior, en nuestro ejemplo:

y_i = variable dependiente—el precio de XOM
x_i1 = tipos de interés
x_i2 = precio del petróleo
x_i3 = valor del índice S&P 500
x_i4= precio de los futuros del petróleo
B₀ = intersección y en el tiempo cero
B₁ = coeficiente de regresión que mide un cambio unitario en la variable dependiente cuando cambia x_i1 - el cambio en el precio de XOM cuando cambian las tasas de interés
B₂ = valor del coeficiente que mide un cambio unitario en la variable dependiente cuando cambia x_i2: el cambio en el precio de XOM cuando cambian los precios del petróleo

Las estimaciones de mínimos cuadrados (B₀, B₁, B₂…B_p) generalmente se calculan mediante software estadístico. Se pueden incluir tantas variables en el modelo de regresión en el que cada variable independiente se diferencia con un número: 1,2, 3, 4... p. El modelo de regresión múltiple permite a un analista predecir un resultado en función de la información proporcionada sobre múltiples variables explicativas.

Aún así, el modelo no siempre es perfectamente preciso ya que cada punto de datos puede diferir ligeramente del resultado predicho por el modelo. El valor residual, E, que es la diferencia entre el resultado real y el resultado previsto, se incluye en el modelo para tener en cuenta estas ligeras variaciones.

Suponiendo que ejecutamos nuestro modelo de regresión de precios XOM a través de un software de cálculo de estadísticas, que devuelve este resultado:

Un analista interpretaría esta producción en el sentido de que si otras variables se mantienen constantes, el precio de XOM aumentará un 7,8 % si el precio del petróleo en los mercados aumenta un 1 %. El modelo también muestra que el precio de XOM disminuirá un 1,5 % tras un aumento del 1 % en los tipos de interés. R² indica que el 86,5% de las variaciones en el precio de las acciones de Exxon Mobil pueden explicarse por cambios en la tasa de interés, el precio del petróleo, los futuros del petróleo y el índice S&P 500.

La diferencia entre regresión lineal y múltiple

cuadrados lineales ordinarios (OLS) compara la respuesta de una variable dependiente ante un cambio en algunas variables explicativas. Sin embargo, una variable dependiente rara vez se explica por una sola variable. En este caso, un analista usa la regresión múltiple, que intenta explicar una variable dependiente usando más de una variable independiente. Las regresiones múltiples pueden ser lineales y no lineales.

Las regresiones múltiples se basan en el supuesto de que existe una relación lineal entre las variables dependientes e independientes. También supone que no existe una correlación importante entre las variables independientes.

Reflejos

La regresión múltiple es una extensión de la regresión lineal (OLS) que usa solo una variable explicativa.
La regresión lineal múltiple (MLR), también conocida simplemente como regresión múltiple, es una técnica estadística que utiliza varias variables explicativas para predecir el resultado de una variable de respuesta.
MLR se usa ampliamente en econometría e inferencia financiera.

PREGUNTAS MÁS FRECUENTES

¿Qué significa que una regresión múltiple sea lineal?

En la regresión lineal múltiple, el modelo calcula la línea de mejor ajuste que minimiza las varianzas de cada una de las variables incluidas en relación con la variable dependiente. Debido a que se ajusta a una línea, es un modelo lineal. También existen modelos de regresión no lineal que involucran múltiples variables, como la regresión logística, la regresión cuadrática y los modelos probit.

¿Cómo se utilizan los modelos de regresión múltiple en finanzas?

Cualquier modelo econométrico que considere más de una variable puede ser un múltiplo. Los modelos de factores comparan dos o más factores para analizar las relaciones entre las variables y el rendimiento resultante. Fama y French Three-Factor Mod es un modelo que amplía el modelo de fijación de precios de activos de capital (CAPM) al agregar factores de riesgo de tamaño y valor al factor de riesgo de mercado en CAPM (que en sí mismo es un modelo de regresión). Al incluir estos dos factores adicionales, el modelo se ajusta a esta tendencia de desempeño superior, que se cree que lo convierte en una mejor herramienta para evaluar el desempeño de los gerentes.

¿Puedo hacer una regresión múltiple a mano?

Es poco probable ya que los modelos de regresión múltiple son complejos y lo son aún más cuando hay más variables incluidas en el modelo o cuando crece la cantidad de datos para analizar. Para ejecutar una regresión múltiple, es probable que necesite usar software estadístico especializado o funciones dentro de programas como Excel.

¿Qué hace que una regresión múltiple sea múltiple?

Una regresión múltiple considera el efecto de más de una variable explicativa sobre algún resultado de interés. Evalúa el efecto relativo de estas variables explicativas o independientes sobre la variable dependiente cuando se mantienen constantes todas las demás variables del modelo.

¿Por qué se usaría una regresión múltiple en lugar de una regresión OLS simple?

Una variable dependiente rara vez se explica por una sola variable. En tales casos, un analista usa la regresión múltiple, que intenta explicar una variable dependiente usando más de una variable independiente. El modelo, sin embargo, asume que no existen correlaciones importantes entre las variables independientes.