Soma Residual de Quadrados (RSS)
Qual é a soma residual dos quadrados (RSS)?
A soma residual dos quadrados (RSS) é uma técnica estatÃstica usada para medir a quantidade de variância em um conjunto de dados que não é explicada por um modelo de regressão em si. Em vez disso, ele estima a variação nos resÃduos, ou termo de erro.
A regressão linear é uma medida que ajuda a determinar a força da relação entre uma variável dependente e um ou mais outros fatores, conhecidos como variáveis independentes ou explicativas.
Entendendo a Soma Residual dos Quadrados
Em termos gerais, a soma dos quadrados é uma técnica estatÃstica utilizada na análise de regressão para determinar a dispersão dos pontos de dados. Em uma análise de regressão, o objetivo é determinar quão bem uma série de dados pode ser ajustada a uma função que possa ajudar a explicar como a série de dados foi gerada. A soma dos quadrados é usada como uma forma matemática de encontrar a função que melhor se ajusta (varia menos) dos dados.
O RSS mede a quantidade de erro restante entre a função de regressão e o conjunto de dados após a execução do modelo. Uma figura RSS menor representa uma função de regressão bem ajustada aos dados.
O RSS, também conhecido como a soma dos resÃduos quadrados, determina essencialmente o quão bem um modelo de regressão explica ou representa os dados no modelo.
Como calcular a soma residual dos quadrados
RSS = ∑ni=1 (yi - f(xi))2
Onde:
yi = o valor ith da variável a ser prevista
f(xi) = valor previsto de yi
n = limite superior da soma
Soma Residual dos Quadrados (RSS) vs. Erro Padrão Residual (RSE)
O erro padrão residual (RSE) é outro termo estatÃstico usado para descrever a diferença nos desvios padrão dos valores observados versus os valores previstos, conforme mostrado por pontos em uma análise de regressão. É uma medida de qualidade de ajuste que pode ser usada para analisar quão bem um conjunto de pontos de dados se ajusta ao modelo real.
O RSE é calculado dividindo o RSS pelo número de observações na amostra menos 2 e, em seguida, obtendo a raiz quadrada: RSE = [RSS/(n-2)]1/2
Considerações Especiais
Os mercados financeiros tornaram-se cada vez mais orientados quantitativamente; assim, em busca de vantagem, muitos investidores estão usando técnicas estatÃsticas avançadas para auxiliar em suas decisões. Big data, aprendizado de máquina e aplicativos de inteligência artificial exigem ainda mais o uso de propriedades estatÃsticas para orientar as estratégias de investimento contemporâneas. A soma de quadrados residual — ou estatÃsticas RSS — é uma das muitas propriedades estatÃsticas que estão passando por um renascimento.
Modelos estatÃsticos são usados por investidores e gerentes de portfólio para rastrear o preço de um investimento e usar esses dados para prever movimentos futuros. O estudo - chamado de análise de regressão - pode envolver a análise da relação nos movimentos de preços entre uma mercadoria e as ações das empresas envolvidas na produção da mercadoria.
Encontrar manualmente a soma dos quadrados dos resÃduos (RSS) pode ser difÃcil e demorado. Como envolve muita subtração, quadratura e soma, os cálculos podem ser propensos a erros. Por esse motivo, você pode optar por usar um software, como o Excel, para fazer os cálculos.
Qualquer modelo pode ter variações entre os valores previstos e os resultados reais. Embora as variações possam ser explicadas pela análise de regressão, o RSS representa as variações ou erros que não são explicados.
Uma vez que uma função de regressão suficientemente complexa pode ser feita para se ajustar a praticamente qualquer conjunto de dados, é necessário um estudo mais aprofundado para determinar se a função de regressão é, de fato, útil para explicar a variância do conjunto de dados.
Normalmente, no entanto, um valor menor ou menor para o RSS é ideal em qualquer modelo, pois significa que há menos variação no conjunto de dados. Em outras palavras, quanto menor a soma dos resÃduos quadrados, melhor o modelo de regressão explica os dados.
Exemplo da soma residual dos quadrados
Para uma demonstração simples (mas longa) do cálculo do RSS, considere a conhecida correlação entre os gastos do consumidor de um paÃs e seu PIB. O gráfico a seguir reflete os valores publicados de pendências de consumo e Produto Interno Bruto para os 27 estados da União Europeia, a partir de 2020.
TT
Banco Mundial, 2020.
Os gastos do consumidor e o PIB têm uma forte correlação positiva, sendo possÃvel prever o PIB de um paÃs com base nos gastos do consumidor (CS). Usando a fórmula para uma linha de melhor ajuste,. essa relação pode ser aproximada como:
PIB = 1,3232 x CS + 10447
As unidades para PIB e Gastos do Consumidor estão em milhões de dólares americanos.
Esta fórmula é altamente precisa para a maioria dos propósitos, mas não é perfeita, devido à s variações individuais na economia de cada paÃs. O gráfico a seguir compara o PIB projetado de cada paÃs, com base na fórmula acima, e o PIB real registrado pelo Banco Mundial.
TT
Banco Mundial, 2020.
A coluna à direita indica os quadrados residuais – a diferença quadrada entre cada valor projetado e seu valor real. Os números parecem grandes, mas sua soma é realmente menor do que o RSS para qualquer outra linha de tendência possÃvel. Se uma linha diferente tivesse um RSS menor para esses pontos de dados, essa linha seria a linha de melhor ajuste.
Destaques
Um valor de zero significa que seu modelo é um ajuste perfeito.
O RSS é utilizado por analistas financeiros para estimar a validade de seus modelos econométricos.
A soma dos quadrados dos resÃduos (RSS) mede o nÃvel de variância no termo de erro, ou resÃduos, de um modelo de regressão.
Modelos estatÃsticos são usados por investidores e gestores de portfólio para rastrear o preço de um investimento e usar esses dados para prever movimentos futuros.
Quanto menor a soma residual dos quadrados, melhor o seu modelo se ajusta aos seus dados; quanto maior a soma dos quadrados dos resÃduos, mais pobre seu modelo se ajusta aos seus dados.
PERGUNTAS FREQUENTES
RSS é o mesmo que a soma da estimativa quadrada de erros (SSE)?
A soma dos quadrados dos resÃduos (RSS) também é conhecida como a soma dos quadrados estimados dos erros (SSE).
Qual é a diferença entre a soma residual dos quadrados e a soma total dos quadrados?
A soma dos quadrados total (TSS) mede quanta variação existe nos dados observados, enquanto a soma dos quadrados residual mede a variação do erro entre os dados observados e os valores modelados. Em estatÃstica, os valores da soma dos quadrados residual e da soma dos quadrados total (TSS) são muitas vezes comparados entre si.
A soma residual dos quadrados é o mesmo que R-quadrado?
A soma residual dos quadrados (RSS) é a quantidade absoluta de variação explicada, enquanto R-quadrado é a quantidade absoluta de variação como proporção da variação total.
Uma soma residual de quadrados pode ser zero?
A soma dos quadrados dos resÃduos pode ser zero. Quanto menor a soma residual dos quadrados, melhor o seu modelo se ajusta aos seus dados; quanto maior a soma dos quadrados dos resÃduos, mais pobre seu modelo se ajusta aos seus dados. Um valor de zero significa que seu modelo é um ajuste perfeito.