Investor's wiki

Somme résiduelle des carrés (RSS)

Somme résiduelle des carrés (RSS)

Qu'est-ce que la somme résiduelle des carrés (RSS) ?

La somme résiduelle des carrés (RSS) est une technique statistique utilisée pour mesurer la quantité de variance dans un ensemble de données qui n'est pas expliquée par un modèle de régression lui-même. Au lieu de cela, il estime la variance des résidus, ou terme d'erreur.

La régression linéaire est une mesure qui aide à déterminer la force de la relation entre une variable dépendante et un ou plusieurs autres facteurs, appelés variables indépendantes ou explicatives.

Comprendre la somme résiduelle des carrés

En termes généraux, la somme des carrés est une technique statistique utilisée dans l'analyse de régression pour déterminer la dispersion des points de données. Dans une analyse de régression, l'objectif est de déterminer dans quelle mesure une série de données peut être ajustée à une fonction qui pourrait aider à expliquer comment la série de données a été générée. La somme des carrés est utilisée comme méthode mathématique pour trouver la fonction qui correspond le mieux (varie le moins) à partir des données.

Le RSS mesure la quantité d'erreur restante entre la fonction de régression et l'ensemble de données après l'exécution du modèle. Un chiffre RSS plus petit représente une fonction de régression bien ajustée aux données.

Le RSS, également connu sous le nom de somme des résidus au carré, détermine essentiellement dans quelle mesure un modèle de régression explique ou représente les données dans le modèle.

Comment calculer la somme résiduelle des carrés

RSS = ∑ni=1 (yi - f(xi))2

Où :

yi = la iième valeur de la variable à prédire

f(xi) = valeur prédite de yi

n = limite supérieure de sommation

Somme résiduelle des carrés (RSS) par rapport à l'erreur type résiduelle (RSE)

L'erreur type résiduelle (RSE) est un autre terme statistique utilisé pour décrire la différence des écarts types des valeurs observées par rapport aux valeurs prédites, comme indiqué par des points dans une analyse de régression. Il s'agit d'une mesure de la qualité de l'ajustement qui peut être utilisée pour analyser dans quelle mesure un ensemble de points de données correspond au modèle réel.

Le RSE est calculé en divisant le RSS par le nombre d'observations dans l'échantillon moins 2, puis en prenant la racine carrée : RSE = [RSS/(n-2)]1/2

Considérations particulières

Les marchés financiers sont de plus en plus axés sur la quantité ; ainsi, à la recherche d'un avantage, de nombreux investisseurs utilisent des techniques statistiques avancées pour les aider dans leurs décisions. Les applications de mégadonnées, d'apprentissage automatique et d'intelligence artificielle nécessitent en outre l'utilisation de propriétés statistiques pour guider les stratégies d'investissement contemporaines. La somme résiduelle des carrés - ou statistiques RSS - est l'une des nombreuses propriétés statistiques qui connaît une renaissance.

Les modèles statistiques sont utilisés par les investisseurs et les gestionnaires de portefeuille pour suivre le prix d'un investissement et utiliser ces données pour prédire les mouvements futurs. L'étude - appelée analyse de régression - peut impliquer l'analyse de la relation entre les mouvements de prix entre un produit de base et les actions des entreprises engagées dans la production du produit.

Trouver la somme résiduelle des carrés (RSS) à la main peut être difficile et prendre du temps. Parce qu'il implique beaucoup de soustraction, de mise au carré et de sommation, les calculs peuvent être sujets à des erreurs. Pour cette raison, vous pouvez décider d'utiliser un logiciel, tel qu'Excel, pour effectuer les calculs.

Tout modèle peut présenter des écarts entre les valeurs prédites et les résultats réels. Bien que les variances puissent être expliquées par l'analyse de régression, le RSS représente les variances ou les erreurs qui ne sont pas expliquées.

Étant donné qu'une fonction de régression suffisamment complexe peut être créée pour s'adapter étroitement à pratiquement n'importe quel ensemble de données, une étude plus approfondie est nécessaire pour déterminer si la fonction de régression est, en fait, utile pour expliquer la variance de l'ensemble de données.

En règle générale, cependant, une valeur plus petite ou inférieure pour le RSS est idéale dans n'importe quel modèle, car cela signifie qu'il y a moins de variation dans l'ensemble de données. En d'autres termes, plus la somme des carrés des résidus est faible, meilleur est le modèle de régression pour expliquer les données.

Exemple de somme résiduelle des carrés

Pour une démonstration simple (mais longue) du calcul RSS, considérons la corrélation bien connue entre les dépenses de consommation d'un pays et son PIB. Le graphique suivant reflète les valeurs publiées des consommateurs en attente et du produit intérieur brut pour les 27 États de l'Union européenne, à partir de 2020.

TTT

Banque mondiale, 2020.

Les dépenses de consommation et le PIB ont une forte corrélation positive, et il est possible de prédire le PIB d'un pays sur la base des dépenses de consommation (CS). En utilisant la formule d'une ligne de meilleur ajustement,. cette relation peut être approximée comme suit :

PIB = 1,3232 x CS + 10447

Les unités pour le PIB et les dépenses de consommation sont en millions de dollars américains.

Cette formule est très précise dans la plupart des cas, mais elle n'est pas parfaite, en raison des variations individuelles de l'économie de chaque pays. Le tableau suivant compare le PIB projeté de chaque pays, basé sur la formule ci-dessus, et le PIB réel tel qu'enregistré par la Banque mondiale.

TTT

Banque mondiale, 2020.

La colonne de droite indique les carrés résiduels - la différence au carré entre chaque valeur projetée et sa valeur réelle. Les chiffres semblent grands, mais leur somme est en fait inférieure au RSS pour toute autre ligne de tendance possible. Si une ligne différente avait un RSS inférieur pour ces points de données, cette ligne serait la meilleure ligne d'ajustement.

Points forts

  • Une valeur de zéro signifie que votre modèle est parfaitement ajusté.

  • Le RSS est utilisé par les analystes financiers pour estimer la validité de leurs modèles économétriques.

  • La somme résiduelle des carrés (RSS) mesure le niveau de variance du terme d'erreur, ou résidus, d'un modèle de régression.

  • Les modèles statistiques sont utilisés par les investisseurs et les gestionnaires de portefeuille pour suivre le prix d'un investissement et utiliser ces données pour prédire les mouvements futurs.

  • Plus la somme résiduelle des carrés est petite, plus votre modèle s'ajuste à vos données ; plus la somme résiduelle des carrés est élevée, moins votre modèle s'adapte à vos données.

FAQ

RSS est-il identique à la somme de l'estimation au carré des erreurs (SSE) ?

La somme résiduelle des carrés (RSS) est également connue sous le nom de somme de l'estimation au carré des erreurs (SSE).

Quelle est la différence entre la somme résiduelle des carrés et la somme totale des carrés ?

La somme totale des carrés (TSS) mesure la variation des données observées, tandis que la somme résiduelle des carrés mesure la variation de l'erreur entre les données observées et les valeurs modélisées. Dans les statistiques, les valeurs de la somme résiduelle des carrés et de la somme totale des carrés (TSS) sont souvent comparées les unes aux autres.

La somme résiduelle des carrés est-elle la même que R-Squared ?

La somme résiduelle des carrés (RSS) est la quantité absolue de variation expliquée, tandis que R au carré est la quantité absolue de variation en proportion de la variation totale.

Une somme résiduelle des carrés peut-elle être nulle ?

La somme résiduelle des carrés peut être nulle. Plus la somme résiduelle des carrés est petite, plus votre modèle s'adapte à vos données ; plus la somme résiduelle des carrés est élevée, moins votre modèle s'adapte à vos données. Une valeur de zéro signifie que votre modèle est parfaitement ajusté.