Regressão Linear Múltipla (MLR)

Empresas Finanças e Contabilidade de Empresas Análise financeira

O que é Regressão Linear Múltipla (MLR)?

A regressão linear múltipla (MLR), também conhecida simplesmente como regressão múltipla, é uma técnica estatística que usa várias variáveis explicativas para prever o resultado de uma variável de resposta. O objetivo da regressão linear múltipla é modelar a relação linear entre as variáveis explicativas (independentes) e as variáveis de resposta (dependentes). Em essência, a regressão múltipla é a extensão da regressão de mínimos quadrados ordinários (OLS) porque envolve mais de uma variável explicativa.

Fórmula e Cálculo de Regressão Linear Múltipla

$\begin&y_i = \beta_0 + \beta$

O que a regressão linear múltipla pode lhe dizer

A regressão linear simples é uma função que permite a um analista ou estatístico fazer previsões sobre uma variável com base nas informações conhecidas sobre outra variável. A regressão linear só pode ser usada quando se tem duas variáveis contínuas - uma variável independente e uma variável dependente. A variável independente é o parâmetro usado para calcular a variável dependente ou resultado. Um modelo de regressão múltipla se estende a várias variáveis explicativas.

O modelo de regressão múltipla é baseado nas seguintes premissas:

Existe uma relação linear entre as variáveis dependentes e as variáveis independentes
As variáveis independentes não são muito correlacionadas entre si
y_i observações são selecionadas independentemente e aleatoriamente da população
Resíduos devem ser normalmente distribuídos com média 0 e variância σ

O coeficiente de determinação (R-quadrado) é uma métrica estatística usada para medir o quanto da variação no resultado pode ser explicada pela variação nas variáveis independentes. R² sempre aumenta à medida que mais preditores são adicionados ao modelo MLR, mesmo que os preditores possam não estar relacionados à variável de resultado.

R² por si só não pode ser usado para identificar quais preditores devem ser incluídos em um modelo e quais devem ser excluídos. R² só pode estar entre 0 e 1, onde 0 indica que o resultado não pode ser previsto por nenhuma das variáveis independentes e 1 indica que o resultado pode ser previsto sem erro das variáveis independentes.

Ao interpretar os resultados da regressão múltipla, os coeficientes beta são válidos mantendo todas as outras variáveis constantes ("tudo o mais igual"). A saída de uma regressão múltipla pode ser exibida horizontalmente como uma equação ou verticalmente em forma de tabela.

Exemplo de como usar a regressão linear múltipla

Como exemplo, um analista pode querer saber como o movimento do mercado afeta o preço da ExxonMobil (XOM). Nesse caso, sua equação linear terá o valor do índice S&P 500 como variável independente, ou preditor, e o preço de XOM como variável dependente.

Na realidade, vários fatores predizem o resultado de um evento. O movimento de preços da ExxonMobil, por exemplo, depende de mais do que apenas o desempenho do mercado geral. Outros preditores, como o preço do petróleo, as taxas de juros e o movimento do preço do petróleo futuro, podem afetar o preço da XOM e os preços das ações de outras empresas petrolíferas . Para entender uma relação em que mais de duas variáveis estão presentes, utiliza-se a regressão linear múltipla.

A regressão linear múltipla (MLR) é usada para determinar uma relação matemática entre várias variáveis aleatórias. Em outros termos, a MLR examina como várias variáveis independentes estão relacionadas a uma variável dependente. Uma vez que cada um dos fatores independentes tenha sido determinado para prever a variável dependente, as informações sobre as múltiplas variáveis podem ser usadas para criar uma previsão precisa sobre o nível de efeito que eles têm na variável de resultado. O modelo cria uma relação na forma de uma linha reta (linear) que melhor se aproxima de todos os pontos de dados individuais.

Referindo-se à equação MLR acima, em nosso exemplo:

y_i = variável dependente—o preço do XOM
x_i1 = taxas de juros
x_i2 = preço do petróleo
x_i3 = valor do índice S&P 500
x_i4= preço dos futuros de petróleo
B₀ = intercepto y no tempo zero
B₁ = coeficiente de regressão que mede uma mudança unitária na variável dependente quando x_i1 muda - a mudança no preço XOM quando as taxas de juros mudam
B₂ = valor do coeficiente que mede uma mudança unitária na variável dependente quando x_i2 muda - a mudança no preço XOM quando os preços do petróleo mudam

As estimativas de mínimos quadrados—B₀, B₁, B₂…B_p—são normalmente calculadas por software estatístico. Tantas variáveis podem ser incluídas no modelo de regressão em que cada variável independente é diferenciada com um número—1,2, 3, 4...p. O modelo de regressão múltipla permite que um analista preveja um resultado com base nas informações fornecidas em várias variáveis explicativas.

Ainda assim, o modelo nem sempre é perfeitamente preciso, pois cada ponto de dados pode diferir ligeiramente do resultado previsto pelo modelo. O valor residual, E, que é a diferença entre o resultado real e o resultado previsto, é incluído no modelo para levar em conta essas pequenas variações.

Supondo que executamos nosso modelo de regressão de preços XOM por meio de um software de computação estatística, que retorna esta saída:

Um analista interpretaria essa saída como se outras variáveis fossem mantidas constantes, o preço do XOM aumentaria 7,8% se o preço do petróleo nos mercados aumentasse 1%. O modelo também mostra que o preço do XOM diminuirá 1,5% após um aumento de 1% nas taxas de juros. R² indica que 86,5% das variações no preço das ações da Exxon Mobil podem ser explicadas por mudanças na taxa de juros, preço do petróleo, futuros de petróleo e índice S&P 500.

A diferença entre regressão linear e múltipla

de quadrados lineares comuns (OLS) compara a resposta de uma variável dependente dada uma mudança em algumas variáveis explicativas. No entanto, uma variável dependente raramente é explicada por apenas uma variável. Nesse caso, um analista usa regressão múltipla, que tenta explicar uma variável dependente usando mais de uma variável independente. As regressões múltiplas podem ser lineares e não lineares.

As regressões múltiplas são baseadas na suposição de que existe uma relação linear entre as variáveis dependentes e independentes. Também não assume nenhuma correlação importante entre as variáveis independentes.

##Destaques

A regressão múltipla é uma extensão da regressão linear (OLS) que usa apenas uma variável explicativa.
A regressão linear múltipla (MLR), também conhecida simplesmente como regressão múltipla, é uma técnica estatística que utiliza diversas variáveis explicativas para prever o resultado de uma variável de resposta.
MLR é usado extensivamente em econometria e inferência financeira.

##PERGUNTAS FREQUENTES

O que significa uma regressão múltipla ser linear?

Na regressão linear múltipla, o modelo calcula a linha de melhor ajuste que minimiza as variâncias de cada uma das variáveis incluídas no que se refere à variável dependente. Por se ajustar a uma linha, é um modelo linear. Existem também modelos de regressão não linear envolvendo múltiplas variáveis, como regressão logística, regressão quadrática e modelos probit.

Como os modelos de regressão múltipla são usados em finanças?

Qualquer modelo econométrico que analise mais de uma variável pode ser múltiplo. Os modelos fatoriais comparam dois ou mais fatores para analisar as relações entre as variáveis e o desempenho resultante. O Fama and French Three-Factor Mod é um modelo que expande o modelo de precificação de ativos de capital (CAPM) adicionando fatores de risco de tamanho e valor ao fator de risco de mercado no CAPM (que é em si um modelo de regressão). Ao incluir esses dois fatores adicionais, o modelo se ajusta a essa tendência de desempenho superior, o que o torna uma ferramenta melhor para avaliar o desempenho do gerente.

Posso fazer uma regressão múltipla manualmente?

É improvável, pois os modelos de regressão múltipla são complexos e se tornam ainda mais complexos quando há mais variáveis incluídas no modelo ou quando a quantidade de dados a serem analisados cresce. Para executar uma regressão múltipla, você provavelmente precisará usar software estatístico especializado ou funções em programas como o Excel.

O que torna uma regressão múltipla múltipla?

Uma regressão múltipla considera o efeito de mais de uma variável explicativa sobre algum resultado de interesse. Ele avalia o efeito relativo dessas variáveis explicativas, ou independentes, na variável dependente ao manter todas as outras variáveis no modelo constantes.

Por que alguém usaria uma regressão múltipla em vez de uma regressão OLS simples?

Uma variável dependente raramente é explicada por apenas uma variável. Nesses casos, um analista usa regressão múltipla, que tenta explicar uma variável dependente usando mais de uma variável independente. O modelo, no entanto, assume que não há grandes correlações entre as variáveis independentes.