Soma de Quadrados
Qual é a soma dos quadrados?
A soma dos quadrados é uma técnica estatÃstica usada na análise de regressão para determinar a dispersão dos pontos de dados. Em uma análise de regressão,. o objetivo é determinar quão bem uma série de dados pode ser ajustada a uma função que possa ajudar a explicar como a série de dados foi gerada. A soma dos quadrados é usada como uma maneira matemática de encontrar a função que melhor se ajusta (varia menos) dos dados.
A fórmula da soma dos quadrados é
A soma dos quadrados também é conhecida como variação.
O que a soma de quadrados diz a você?
A soma dos quadrados é uma medida de desvio da média. Em estatÃstica, a média é a média de um conjunto de números e é a medida de tendência central mais utilizada . A média aritmética é calculada simplesmente somando os valores no conjunto de dados e dividindo pelo número de valores.
Digamos que os preços de fechamento da Microsoft (MSFT) nos últimos cinco dias foram 74,01, 74,77, 73,94, 73,61 e 73,40 em dólares americanos. A soma dos preços totais é $ 369,73 e o preço médio ou médio do livro didático seria, portanto, $ 369,73 / 5 = $ 73,95.
Mas saber a média de um conjunto de medidas nem sempre é suficiente. Às vezes, é útil saber quanta variação existe em um conjunto de medidas. A distância entre os valores individuais e a média pode dar uma ideia de como as observações ou valores se ajustam ao modelo de regressão que é criado.
Por exemplo, se um analista quiser saber se o preço da ação da MSFT se move em conjunto com o preço da Apple (AAPL), ele pode listar o conjunto de observações para o processo de ambas as ações por um determinado perÃodo, digamos 1, 2 , ou 10 anos e criar um modelo linear com cada uma das observações ou medições registradas. Se a relação entre ambas as variáveis (ou seja, o preço da AAPL e o preço da MSFT) não for uma linha reta, então há variações no conjunto de dados que precisam ser examinadas.
No vernáculo da estatÃstica, se a linha no modelo linear criado não passa por todas as medidas de valor, então parte da variabilidade observada nos preços das ações é inexplicável. A soma dos quadrados é usada para calcular se existe uma relação linear entre duas variáveis, e qualquer variabilidade inexplicada é chamada de soma dos quadrados residual.
A soma dos quadrados é a soma do quadrado da variação, onde a variação é definida como o spread entre cada valor individual e a média. Para determinar a soma dos quadrados, a distância entre cada ponto de dados e a linha de melhor ajuste é elevada ao quadrado e depois somada. A linha de melhor ajuste minimizará esse valor.
Como calcular a soma dos quadrados
Agora você pode ver por que a medida é chamada de soma dos desvios ao quadrado, ou a soma dos quadrados para abreviar. Usando nosso exemplo MSFT acima, a soma dos quadrados pode ser calculada como:
SS = (74,01 - 73,95)2 + (74,77 - 73,95)2 + (73,94 - 73,95)2 + (73,61 - 73,95)2 + (73,40 - 73,95)2
SS = (0,06) 2 + (0,82)2 + (-0,01)2 + (-0,34)2 + (-0,55)2
SS = 1,0942
Adicionando a soma dos desvios sozinho sem elevar ao quadrado resultará em um número igual ou próximo de zero, pois os desvios negativos compensarão quase perfeitamente os desvios positivos. Para obter um número mais realista, a soma dos desvios deve ser elevada ao quadrado. A soma dos quadrados sempre será um número positivo porque o quadrado de qualquer número, seja positivo ou negativo, é sempre positivo.
Exemplo de como usar a soma dos quadrados
Com base nos resultados do cálculo da MSFT, uma soma de quadrados alta indica que a maioria dos valores está mais distante da média e, portanto, há grande variabilidade nos dados. Uma soma de quadrados baixa refere-se a uma baixa variabilidade no conjunto de observações.
No exemplo acima, 1,0942 mostra que a variabilidade no preço das ações da MSFT nos últimos cinco dias é muito baixa e os investidores que procuram investir em ações são caracterizados pela estabilidade de preços e baixa volatilidade podem optar pela MSFT.
Limitações do uso da soma de quadrados
Tomar uma decisão de investimento sobre qual ação comprar requer muito mais observações do que as listadas aqui. Um analista pode ter que trabalhar com anos de dados para saber com maior certeza quão alta ou baixa é a variabilidade de um ativo. À medida que mais pontos de dados são adicionados ao conjunto, a soma dos quadrados se torna maior, pois os valores serão mais espalhados.
As medidas de variação mais utilizadas são o desvio padrão e a variância. No entanto, para calcular qualquer uma das duas métricas, a soma dos quadrados deve primeiro ser calculada. A variância é a média da soma dos quadrados (ou seja, a soma dos quadrados dividida pelo número de observações). O desvio padrão é a raiz quadrada da variância.
Existem dois métodos de análise de regressão que utilizam a soma dos quadrados: o método linear dos mÃnimos quadrados e o método não linear dos mÃnimos quadrados. O método dos mÃnimos quadrados refere-se ao fato de que a função de regressão minimiza a soma dos quadrados da variância dos pontos de dados reais. Desta forma, é possÃvel desenhar uma função que estatisticamente fornece o melhor ajuste para os dados. Observe que uma função de regressão pode ser linear (uma linha reta) ou não linear (uma linha curva).
##Destaques
A soma dos quadrados mede o desvio dos pontos de dados em relação ao valor médio.
Um resultado de soma de quadrados mais alto indica um grande grau de variabilidade dentro do conjunto de dados, enquanto um resultado mais baixo indica que os dados não variam consideravelmente do valor médio.