Investor's wiki

Soma Residual de Quadrados (RSS)

Soma Residual de Quadrados (RSS)

Qual é a soma residual dos quadrados (RSS)?

A soma residual dos quadrados (RSS) é uma técnica estatística usada para medir a quantidade de variância em um conjunto de dados que não é explicada por um modelo de regressão em si. Em vez disso, ele estima a variação nos resíduos, ou termo de erro.

A regressão linear é uma medida que ajuda a determinar a força da relação entre uma variável dependente e um ou mais outros fatores, conhecidos como variáveis independentes ou explicativas.

Entendendo a Soma Residual dos Quadrados

Em termos gerais, a soma dos quadrados é uma técnica estatística utilizada na análise de regressão para determinar a dispersão dos pontos de dados. Em uma análise de regressão, o objetivo é determinar quão bem uma série de dados pode ser ajustada a uma função que possa ajudar a explicar como a série de dados foi gerada. A soma dos quadrados é usada como uma forma matemática de encontrar a função que melhor se ajusta (varia menos) dos dados.

O RSS mede a quantidade de erro restante entre a função de regressão e o conjunto de dados após a execução do modelo. Uma figura RSS menor representa uma função de regressão bem ajustada aos dados.

O RSS, também conhecido como a soma dos resíduos quadrados, determina essencialmente o quão bem um modelo de regressão explica ou representa os dados no modelo.

Como calcular a soma residual dos quadrados

RSS = ∑ni=1 (yi - f(xi))2

Onde:

yi = o valor ith da variável a ser prevista

f(xi) = valor previsto de yi

n = limite superior da soma

Soma Residual dos Quadrados (RSS) vs. Erro Padrão Residual (RSE)

O erro padrão residual (RSE) é outro termo estatístico usado para descrever a diferença nos desvios padrão dos valores observados versus os valores previstos, conforme mostrado por pontos em uma análise de regressão. É uma medida de qualidade de ajuste que pode ser usada para analisar quão bem um conjunto de pontos de dados se ajusta ao modelo real.

O RSE é calculado dividindo o RSS pelo número de observações na amostra menos 2 e, em seguida, obtendo a raiz quadrada: RSE = [RSS/(n-2)]1/2

Considerações Especiais

Os mercados financeiros tornaram-se cada vez mais orientados quantitativamente; assim, em busca de vantagem, muitos investidores estão usando técnicas estatísticas avançadas para auxiliar em suas decisões. Big data, aprendizado de máquina e aplicativos de inteligência artificial exigem ainda mais o uso de propriedades estatísticas para orientar as estratégias de investimento contemporâneas. A soma de quadrados residual — ou estatísticas RSS — é uma das muitas propriedades estatísticas que estão passando por um renascimento.

Modelos estatísticos são usados por investidores e gerentes de portfólio para rastrear o preço de um investimento e usar esses dados para prever movimentos futuros. O estudo - chamado de análise de regressão - pode envolver a análise da relação nos movimentos de preços entre uma mercadoria e as ações das empresas envolvidas na produção da mercadoria.

Encontrar manualmente a soma dos quadrados dos resíduos (RSS) pode ser difícil e demorado. Como envolve muita subtração, quadratura e soma, os cálculos podem ser propensos a erros. Por esse motivo, você pode optar por usar um software, como o Excel, para fazer os cálculos.

Qualquer modelo pode ter variações entre os valores previstos e os resultados reais. Embora as variações possam ser explicadas pela análise de regressão, o RSS representa as variações ou erros que não são explicados.

Uma vez que uma função de regressão suficientemente complexa pode ser feita para se ajustar a praticamente qualquer conjunto de dados, é necessário um estudo mais aprofundado para determinar se a função de regressão é, de fato, útil para explicar a variância do conjunto de dados.

Normalmente, no entanto, um valor menor ou menor para o RSS é ideal em qualquer modelo, pois significa que há menos variação no conjunto de dados. Em outras palavras, quanto menor a soma dos resíduos quadrados, melhor o modelo de regressão explica os dados.

Exemplo da soma residual dos quadrados

Para uma demonstração simples (mas longa) do cálculo do RSS, considere a conhecida correlação entre os gastos do consumidor de um país e seu PIB. O gráfico a seguir reflete os valores publicados de pendências de consumo e Produto Interno Bruto para os 27 estados da União Europeia, a partir de 2020.

TT

Banco Mundial, 2020.

Os gastos do consumidor e o PIB têm uma forte correlação positiva, sendo possível prever o PIB de um país com base nos gastos do consumidor (CS). Usando a fórmula para uma linha de melhor ajuste,. essa relação pode ser aproximada como:

PIB = 1,3232 x CS + 10447

As unidades para PIB e Gastos do Consumidor estão em milhões de dólares americanos.

Esta fórmula é altamente precisa para a maioria dos propósitos, mas não é perfeita, devido às variações individuais na economia de cada país. O gráfico a seguir compara o PIB projetado de cada país, com base na fórmula acima, e o PIB real registrado pelo Banco Mundial.

TT

Banco Mundial, 2020.

A coluna à direita indica os quadrados residuais – a diferença quadrada entre cada valor projetado e seu valor real. Os números parecem grandes, mas sua soma é realmente menor do que o RSS para qualquer outra linha de tendência possível. Se uma linha diferente tivesse um RSS menor para esses pontos de dados, essa linha seria a linha de melhor ajuste.

Destaques

  • Um valor de zero significa que seu modelo é um ajuste perfeito.

  • O RSS é utilizado por analistas financeiros para estimar a validade de seus modelos econométricos.

  • A soma dos quadrados dos resíduos (RSS) mede o nível de variância no termo de erro, ou resíduos, de um modelo de regressão.

  • Modelos estatísticos são usados por investidores e gestores de portfólio para rastrear o preço de um investimento e usar esses dados para prever movimentos futuros.

  • Quanto menor a soma residual dos quadrados, melhor o seu modelo se ajusta aos seus dados; quanto maior a soma dos quadrados dos resíduos, mais pobre seu modelo se ajusta aos seus dados.

PERGUNTAS FREQUENTES

RSS é o mesmo que a soma da estimativa quadrada de erros (SSE)?

A soma dos quadrados dos resíduos (RSS) também é conhecida como a soma dos quadrados estimados dos erros (SSE).

Qual é a diferença entre a soma residual dos quadrados e a soma total dos quadrados?

A soma dos quadrados total (TSS) mede quanta variação existe nos dados observados, enquanto a soma dos quadrados residual mede a variação do erro entre os dados observados e os valores modelados. Em estatística, os valores da soma dos quadrados residual e da soma dos quadrados total (TSS) são muitas vezes comparados entre si.

A soma residual dos quadrados é o mesmo que R-quadrado?

A soma residual dos quadrados (RSS) é a quantidade absoluta de variação explicada, enquanto R-quadrado é a quantidade absoluta de variação como proporção da variação total.

Uma soma residual de quadrados pode ser zero?

A soma dos quadrados dos resíduos pode ser zero. Quanto menor a soma residual dos quadrados, melhor o seu modelo se ajusta aos seus dados; quanto maior a soma dos quadrados dos resíduos, mais pobre seu modelo se ajusta aos seus dados. Um valor de zero significa que seu modelo é um ajuste perfeito.