Investor's wiki

Suma residual de cuadrados (RSS)

Suma residual de cuadrados (RSS)

¿Qué es la suma residual de cuadrados (RSS)?

La suma residual de cuadrados (RSS) es una técnica estadística utilizada para medir la cantidad de varianza en un conjunto de datos que no se explica por un modelo de regresión en sí. En cambio, estima la varianza en los residuos, o término de error.

La regresión lineal es una medida que ayuda a determinar la fuerza de la relación entre una variable dependiente y uno o más factores, conocidos como variables independientes o explicativas.

Comprender la suma residual de cuadrados

En términos generales, la suma de cuadrados es una técnica estadística utilizada en el análisis de regresión para determinar la dispersión de puntos de datos. En un análisis de regresión, el objetivo es determinar qué tan bien se puede ajustar una serie de datos a una función que podría ayudar a explicar cómo se generó la serie de datos. La suma de cuadrados se usa como una forma matemática de encontrar la función que mejor se ajusta (varía menos) a partir de los datos.

El RSS mide la cantidad de error restante entre la función de regresión y el conjunto de datos después de ejecutar el modelo. Una cifra de RSS más pequeña representa una función de regresión que se ajusta bien a los datos.

El RSS, también conocido como la suma de los residuos al cuadrado, determina esencialmente qué tan bien un modelo de regresión explica o representa los datos en el modelo.

Cómo calcular la suma residual de cuadrados

RSS = ni=1 (yi - f(xi))2

Dónde:

yi = el valor ith de la variable a predecir

f(xi) = valor predicho de yi

n = límite superior de suma

Suma residual de cuadrados (RSS) frente a error estándar residual (RSE)

El error estándar residual (RSE) es otro término estadístico que se utiliza para describir la diferencia en las desviaciones estándar de los valores observados frente a los valores predichos, como se muestra en los puntos de un análisis de regresión. Es una medida de bondad de ajuste que se puede utilizar para analizar qué tan bien se ajusta un conjunto de puntos de datos con el modelo real.

RSE se calcula dividiendo el RSS por el número de observaciones en la muestra menos 2, y luego sacando la raíz cuadrada: RSE = [RSS/(n-2)]1/2

Consideraciones Especiales

Los mercados financieros se han vuelto cada vez más impulsados cuantitativamente; como tal, en busca de una ventaja, muchos inversores están utilizando técnicas estadísticas avanzadas para ayudar en sus decisiones. Las aplicaciones de big data, aprendizaje automático e inteligencia artificial requieren además el uso de propiedades estadísticas para guiar las estrategias de inversión contemporáneas. La suma residual de cuadrados, o estadísticas RSS, es una de las muchas propiedades estadísticas que disfrutan de un renacimiento.

Los inversores y gestores de cartera utilizan modelos estadísticos para realizar un seguimiento del precio de una inversión y utilizar esos datos para predecir movimientos futuros. El estudio, llamado análisis de regresión, podría involucrar el análisis de la relación en los movimientos de precios entre un producto básico y las acciones de las empresas dedicadas a producir el producto básico.

Encontrar la suma residual de cuadrados (RSS) a mano puede ser difícil y llevar mucho tiempo. Debido a que implica muchas restas, cuadraturas y sumas, los cálculos pueden ser propensos a errores. Por esta razón, puede decidir usar un software, como Excel, para hacer los cálculos.

Cualquier modelo puede tener variaciones entre los valores predichos y los resultados reales. Aunque las varianzas pueden ser explicadas por el análisis de regresión, el RSS representa las varianzas o errores que no se explican.

Dado que se puede hacer una función de regresión lo suficientemente compleja para que se ajuste prácticamente a cualquier conjunto de datos, es necesario realizar más estudios para determinar si la función de regresión es, de hecho, útil para explicar la varianza del conjunto de datos.

Sin embargo, por lo general, un valor más pequeño o más bajo para el RSS es ideal en cualquier modelo, ya que significa que hay menos variación en el conjunto de datos. En otras palabras, cuanto menor sea la suma de los residuos cuadrados, mejor será el modelo de regresión para explicar los datos.

Ejemplo de la Suma Residual de Cuadrados

Para una demostración simple (pero larga) del cálculo del RSS, considere la conocida correlación entre el gasto del consumidor de un país y su PIB. El siguiente cuadro refleja los valores publicados de consumo pendiente y Producto Interno Bruto para los 27 estados de la Unión Europea, a partir de 2020.

TTT

Banco Mundial, 2020.

El gasto del consumidor y el PIB tienen una fuerte correlación positiva, y es posible predecir el PIB de un país en función del gasto del consumidor (CS). Usando la fórmula para una línea de mejor ajuste,. esta relación se puede aproximar como:

PIB = 1.3232 x CS + 10447

Las unidades tanto para el PIB como para el Gasto del Consumidor están en millones de dólares estadounidenses.

Esta fórmula es muy precisa para la mayoría de los propósitos, pero no es perfecta debido a las variaciones individuales en la economía de cada país. El siguiente gráfico compara el PIB proyectado de cada país, basado en la fórmula anterior, y el PIB real registrado por el Banco Mundial.

TTT

Banco Mundial, 2020.

La columna de la derecha indica los cuadrados residuales: la diferencia al cuadrado entre cada valor proyectado y su valor real. Los números parecen grandes, pero su suma es en realidad más baja que el RSS para cualquier otra línea de tendencia posible. Si una línea diferente tuviera un RSS más bajo para estos puntos de datos, esa línea sería la línea de mejor ajuste.

Reflejos

  • Un valor de cero significa que su modelo se ajusta perfectamente.

  • El RSS es utilizado por los analistas financieros para estimar la validez de sus modelos econométricos.

  • La suma residual de cuadrados (RSS) mide el nivel de varianza en el término de error, o residuos, de un modelo de regresión.

  • Los inversores y gestores de cartera utilizan modelos estadísticos para realizar un seguimiento del precio de una inversión y utilizar esos datos para predecir movimientos futuros.

  • Cuanto menor sea la suma residual de los cuadrados, mejor se ajustará su modelo a sus datos; cuanto mayor sea la suma residual de los cuadrados, peor se ajustará su modelo a sus datos.

PREGUNTAS MÁS FRECUENTES

¿Es RSS lo mismo que la suma de la estimación de errores al cuadrado (SSE)?

La suma residual de cuadrados (RSS) también se conoce como la suma de cuadrados de estimación de errores (SSE).

¿Cuál es la diferencia entre la suma residual de cuadrados y la suma total de cuadrados?

La suma total de cuadrados (TSS) mide cuánta variación hay en los datos observados, mientras que la suma residual de cuadrados mide la variación en el error entre los datos observados y los valores modelados. En estadística, los valores de la suma residual de cuadrados y la suma total de cuadrados (TSS) a menudo se comparan entre sí.

¿Es la suma residual de cuadrados lo mismo que R-Squared?

La suma residual de cuadrados (RSS) es la cantidad absoluta de variación explicada, mientras que R-squared es la cantidad absoluta de variación como proporción de la variación total.

¿Puede una suma residual de cuadrados ser cero?

La suma residual de cuadrados puede ser cero. Cuanto menor sea la suma residual de los cuadrados, mejor se ajustará su modelo a sus datos; cuanto mayor sea la suma residual de los cuadrados, peor se ajustará su modelo a sus datos. Un valor de cero significa que su modelo se ajusta perfectamente.