Investor's wiki

残差平方和(RSS)

残差平方和(RSS)

##残差平方和(RSS)とは何ですか?

残差平方和(RSS)は、回帰モデル自体では説明されないデータセットの分散量を測定するために使用される統計手法です。代わりに、残差の分散、つまり誤差項を推定します

線形回帰は、従属変数と、独立変数または説明変数として知られる1つ以上の他の要因との間の関係の強さを決定するのに役立つ測定値です。

##残差平方和を理解する

一般的に、二乗和は、データポイントの分散を決定するために回帰分析で使用される統計手法です。回帰分析の目標は、データ系列がどのように生成されたかを説明するのに役立つ可能性のある関数にデータ系列をどの程度適合させることができるかを判断することです。二乗和は、データから最もよく適合する(最も変化が少ない)関数を見つけるための数学的な方法として使用されます。

RSSは、モデルの実行後に回帰関数とデータセットの間に残っているエラーの量を測定します。小さいRSSの数値は、データによく適合する回帰関数を表しています。

RSSは、残差平方和とも呼ばれ、基本的に、回帰モデルがモデル内のデータをどの程度説明または表現するかを決定します。

##残差平方和の計算方法

RSS = ** ∑ ** ^ n 〜i = 1〜(** yi - f xi **)) 2 ^

場所:

y〜i〜=予測される変数のi th

** f **(x〜i〜)= y〜i〜の予測値

n=合計の上限

##残差平方和(RSS)と残差標準誤差(RSE)

、回帰分析のポイントで示される、観測値と予測値の標準偏差の差を表すために使用される別の統計用語です。これは、データポイントのセットが実際のモデルにどの程度適合しているかを分析するために使用できる適合度の尺度です。

RSEは、RSSをサンプル内の観測数から2を引いた数で除算し、平方根をとることによって計算されます。RSE = [RSS /(n-2)] ^ 1/2 ^

##特別な考慮事項

金融市場はますます定量的に推進されるようになっています。そのため、エッジを求めて、多くの投資家は高度な統計手法を使用して意思決定を支援しています。ビッグデータ、機械学習、人工知能のアプリケーションでは、統計的特性を使用して現代の投資戦略を導く必要があります。残差平方和(またはRSS統計)は、ルネッサンスを享受している多くの統計プロパティの1つです。

統計モデルは、投資家やポートフォリオマネージャーが投資の価格を追跡し、そのデータを使用して将来の動きを予測するために使用されます。回帰分析と呼ばれるこの調査には、商品とその商品の生産に従事する企業の株式との間の価格変動の関係の分析が含まれる場合があります。

残差二乗和(RSS)を手動で見つけることは、困難で時間がかかる場合があります。減算、二乗、合計が多く含まれるため、計算でエラーが発生する可能性があります。このため、Excelなどのソフトウェアを使用して計算を行うことができます。

どのモデルでも、予測値と実際の結果の間に差異がある可能性があります。分散は回帰分析によって説明される場合がありますが、RSSは説明されていない分散またはエラーを表します。

十分に複雑な回帰関数を作成して、事実上すべてのデータセットに厳密に適合させることができるため、回帰関数が実際にデータセットの分散を説明するのに役立つかどうかを判断するには、さらに調査が必要です。

ただし、通常、RSSの値は、データセットの変動が少ないことを意味するため、どのモデルでも小さいか小さい方が理想的です。言い換えると、残差平方和が小さいほど、回帰モデルはデータをより適切に説明できます。

##残差平方和の例

RSS計算の簡単な(しかし長い)デモンストレーションについては、国の個人消費とそのGDPの間のよく知られた相関関係を考慮してください。次のグラフは、 2020年現在の欧州連合の27の州の消費者の保留中および国内総生産の公表値を反映しています。

TTT

世界銀行、2020年。

個人消費とGDPには強い正の相関関係があり、個人消費(CS)に基づいて国のGDPを予測することが可能です。最適な線の式を使用すると、この関係は次のように概算できます。

GDP = 1.3232 x CS + 10447

GDPと消費者支出の両方の単位は数百万米ドルです。

この公式はほとんどの目的で非常に正確ですが、各国の経済には個人差があるため、完全ではありません。次のグラフは、上記の式に基づいた各国の予測GDPと、世界銀行が記録した実際のGDPを比較したものです。

TTT

世界銀行、2020年。

右側の列は、残差平方和、つまり各予測値と実際の値の差の二乗を示しています。数値は大きいように見えますが、それらの合計は、他の可能なトレンドラインのRSSよりも実際には低くなっています。別の回線のRSSがこれらのデータポイントに対して低い場合、その回線が最適な回線になります。

##ハイライト

-ゼロの値は、モデルが完全に適合していることを意味します。

-RSSは、金融アナリストが計量経済モデルの妥当性を推定するために使用します。

-残差平方和(RSS)は、回帰モデルの誤差項または残差の分散のレベルを測定します。

-統計モデルは、投資家とポートフォリオマネージャーが投資の価格を追跡し、そのデータを使用して将来の動きを予測するために使用されます。

-残差平方和が小さいほど、モデルはデータによく適合します。残差平方和が大きいほど、モデルのデータへの適合度は低くなります。

## よくある質問

RSSは、誤差の二乗和(SSE)と同じですか?

残差平方和(RSS)は、誤差の二乗和(SSE)とも呼ばれます。

###残差平方和と総平方和の違いは何ですか?

総平方和(TSS)は、観測データにどの程度の変動があるかを測定し、残差平方和は、観測データとモデル化された値の間の誤差の変動を測定します。統計では、残差平方和と総平方和(TSS)の値が互いに比較されることがよくあります。

###残差平方和は決定係数と同じですか?

残差平方和(RSS)は説明された変動の絶対量であり、R-squaredは全変動の割合としての変動の絶対量です。

###残差平方和をゼロにすることはできますか?

残差平方和はゼロにすることができます。残差平方和が小さいほど、モデルはデータによく適合します。残差平方和が大きいほど、モデルのデータへの適合度は低くなります。ゼロの値は、モデルが完全に適合していることを意味します。