Regressão Linear Múltipla (MLR)
O que é Regressão Linear Múltipla (MLR)?
A regressão linear múltipla (MLR), também conhecida simplesmente como regressão múltipla, é uma técnica estatÃstica que usa várias variáveis explicativas para prever o resultado de uma variável de resposta. O objetivo da regressão linear múltipla é modelar a relação linear entre as variáveis explicativas (independentes) e as variáveis de resposta (dependentes). Em essência, a regressão múltipla é a extensão da regressão de mÃnimos quadrados ordinários (OLS) porque envolve mais de uma variável explicativa.
Fórmula e Cálculo de Regressão Linear Múltipla
< span class="katex-html" aria-hidden="true">< /span> < span class="pstrut" style="height:2.84em;">​ yi<​</ span ></ span >=β0</ span> +β1</ span>< span> xi1 < /span>+β2<​< span class="vlist-r">< / span>x< span class="pstrut" style="height:2.7em;">i2<​< /span >< /span >< span class="mspace" style="margin-right:0.2222222222222222em;">+...+β< span class="mord mathnormal mtight">p<​</ span>xip< /span></ span>+ϵ</ span>onde, para i=n observações : s< /span> i​ =< /span>variável dependente< span class="mord mathnormal">xi = < span class="mord">variáveis ​​explicativasβ0</sp an>= interceptação y (termo constante)β< span class="vlist" style="height:0.15139200000000003em;">p< span class="vlist" style="height:0.286108em;">=</ span >coeficientes de inclinação para cada variável explicativaϵ=o termo de erro do modelo (também conhecido como resÃduos)</ span >< /span>
O que a regressão linear múltipla pode lhe dizer
A regressão linear simples é uma função que permite a um analista ou estatÃstico fazer previsões sobre uma variável com base nas informações conhecidas sobre outra variável. A regressão linear só pode ser usada quando se tem duas variáveis contÃnuas - uma variável independente e uma variável dependente. A variável independente é o parâmetro usado para calcular a variável dependente ou resultado. Um modelo de regressão múltipla se estende a várias variáveis explicativas.
O modelo de regressão múltipla é baseado nas seguintes premissas:
Existe uma relação linear entre as variáveis dependentes e as variáveis independentes
As variáveis independentes não são muito correlacionadas entre si
yi observações são selecionadas independentemente e aleatoriamente da população
ResÃduos devem ser normalmente distribuÃdos com média 0 e variância σ
O coeficiente de determinação (R-quadrado) é uma métrica estatÃstica usada para medir o quanto da variação no resultado pode ser explicada pela variação nas variáveis independentes. R2 sempre aumenta à medida que mais preditores são adicionados ao modelo MLR, mesmo que os preditores possam não estar relacionados à variável de resultado.
R2 por si só não pode ser usado para identificar quais preditores devem ser incluÃdos em um modelo e quais devem ser excluÃdos. R2 só pode estar entre 0 e 1, onde 0 indica que o resultado não pode ser previsto por nenhuma das variáveis independentes e 1 indica que o resultado pode ser previsto sem erro das variáveis independentes.
Ao interpretar os resultados da regressão múltipla, os coeficientes beta são válidos mantendo todas as outras variáveis constantes ("tudo o mais igual"). A saÃda de uma regressão múltipla pode ser exibida horizontalmente como uma equação ou verticalmente em forma de tabela.
Exemplo de como usar a regressão linear múltipla
Como exemplo, um analista pode querer saber como o movimento do mercado afeta o preço da ExxonMobil (XOM). Nesse caso, sua equação linear terá o valor do Ãndice S&P 500 como variável independente, ou preditor, e o preço de XOM como variável dependente.
Na realidade, vários fatores predizem o resultado de um evento. O movimento de preços da ExxonMobil, por exemplo, depende de mais do que apenas o desempenho do mercado geral. Outros preditores, como o preço do petróleo, as taxas de juros e o movimento do preço do petróleo futuro, podem afetar o preço da XOM e os preços das ações de outras empresas petrolÃferas . Para entender uma relação em que mais de duas variáveis estão presentes, utiliza-se a regressão linear múltipla.
A regressão linear múltipla (MLR) é usada para determinar uma relação matemática entre várias variáveis aleatórias. Em outros termos, a MLR examina como várias variáveis independentes estão relacionadas a uma variável dependente. Uma vez que cada um dos fatores independentes tenha sido determinado para prever a variável dependente, as informações sobre as múltiplas variáveis podem ser usadas para criar uma previsão precisa sobre o nÃvel de efeito que eles têm na variável de resultado. O modelo cria uma relação na forma de uma linha reta (linear) que melhor se aproxima de todos os pontos de dados individuais.
Referindo-se à equação MLR acima, em nosso exemplo:
yi = variável dependente—o preço do XOM
xi1 = taxas de juros
xi2 = preço do petróleo
xi3 = valor do Ãndice S&P 500
xi4= preço dos futuros de petróleo
B0 = intercepto y no tempo zero
B1 = coeficiente de regressão que mede uma mudança unitária na variável dependente quando xi1 muda - a mudança no preço XOM quando as taxas de juros mudam
B2 = valor do coeficiente que mede uma mudança unitária na variável dependente quando xi2 muda - a mudança no preço XOM quando os preços do petróleo mudam
As estimativas de mÃnimos quadrados—B0, B1, B2…Bp—são normalmente calculadas por software estatÃstico. Tantas variáveis podem ser incluÃdas no modelo de regressão em que cada variável independente é diferenciada com um número—1,2, 3, 4...p. O modelo de regressão múltipla permite que um analista preveja um resultado com base nas informações fornecidas em várias variáveis explicativas.
Ainda assim, o modelo nem sempre é perfeitamente preciso, pois cada ponto de dados pode diferir ligeiramente do resultado previsto pelo modelo. O valor residual, E, que é a diferença entre o resultado real e o resultado previsto, é incluÃdo no modelo para levar em conta essas pequenas variações.
Supondo que executamos nosso modelo de regressão de preços XOM por meio de um software de computação estatÃstica, que retorna esta saÃda:
Um analista interpretaria essa saÃda como se outras variáveis fossem mantidas constantes, o preço do XOM aumentaria 7,8% se o preço do petróleo nos mercados aumentasse 1%. O modelo também mostra que o preço do XOM diminuirá 1,5% após um aumento de 1% nas taxas de juros. R2 indica que 86,5% das variações no preço das ações da Exxon Mobil podem ser explicadas por mudanças na taxa de juros, preço do petróleo, futuros de petróleo e Ãndice S&P 500.
A diferença entre regressão linear e múltipla
de quadrados lineares comuns (OLS) compara a resposta de uma variável dependente dada uma mudança em algumas variáveis explicativas. No entanto, uma variável dependente raramente é explicada por apenas uma variável. Nesse caso, um analista usa regressão múltipla, que tenta explicar uma variável dependente usando mais de uma variável independente. As regressões múltiplas podem ser lineares e não lineares.
As regressões múltiplas são baseadas na suposição de que existe uma relação linear entre as variáveis dependentes e independentes. Também não assume nenhuma correlação importante entre as variáveis independentes.
##Destaques
A regressão múltipla é uma extensão da regressão linear (OLS) que usa apenas uma variável explicativa.
A regressão linear múltipla (MLR), também conhecida simplesmente como regressão múltipla, é uma técnica estatÃstica que utiliza diversas variáveis explicativas para prever o resultado de uma variável de resposta.
MLR é usado extensivamente em econometria e inferência financeira.
##PERGUNTAS FREQUENTES
O que significa uma regressão múltipla ser linear?
Na regressão linear múltipla, o modelo calcula a linha de melhor ajuste que minimiza as variâncias de cada uma das variáveis incluÃdas no que se refere à variável dependente. Por se ajustar a uma linha, é um modelo linear. Existem também modelos de regressão não linear envolvendo múltiplas variáveis, como regressão logÃstica, regressão quadrática e modelos probit.
Como os modelos de regressão múltipla são usados em finanças?
Qualquer modelo econométrico que analise mais de uma variável pode ser múltiplo. Os modelos fatoriais comparam dois ou mais fatores para analisar as relações entre as variáveis e o desempenho resultante. O Fama and French Three-Factor Mod é um modelo que expande o modelo de precificação de ativos de capital (CAPM) adicionando fatores de risco de tamanho e valor ao fator de risco de mercado no CAPM (que é em si um modelo de regressão). Ao incluir esses dois fatores adicionais, o modelo se ajusta a essa tendência de desempenho superior, o que o torna uma ferramenta melhor para avaliar o desempenho do gerente.
Posso fazer uma regressão múltipla manualmente?
É improvável, pois os modelos de regressão múltipla são complexos e se tornam ainda mais complexos quando há mais variáveis incluÃdas no modelo ou quando a quantidade de dados a serem analisados cresce. Para executar uma regressão múltipla, você provavelmente precisará usar software estatÃstico especializado ou funções em programas como o Excel.
O que torna uma regressão múltipla múltipla?
Uma regressão múltipla considera o efeito de mais de uma variável explicativa sobre algum resultado de interesse. Ele avalia o efeito relativo dessas variáveis explicativas, ou independentes, na variável dependente ao manter todas as outras variáveis no modelo constantes.
Por que alguém usaria uma regressão múltipla em vez de uma regressão OLS simples?
Uma variável dependente raramente é explicada por apenas uma variável. Nesses casos, um analista usa regressão múltipla, que tenta explicar uma variável dependente usando mais de uma variável independente. O modelo, no entanto, assume que não há grandes correlações entre as variáveis independentes.