R-Squared
R-Squaredとは何ですか?
決定係数(R ^ 2 ^)は、独立変数または回帰モデルの変数によって説明される従属変数の分散の比率を表す統計的尺度です。相関は独立変数と従属変数の間の関係の強さを説明しますが、R-squaredは、1つの変数の分散が2番目の変数の分散をどの程度説明するかを説明します。したがって、モデルのR ^ 2 ^が0.50の場合、観測された変動の約半分はモデルの入力によって説明できます。
##決定係数の式
1
決定係数の実際の計算には、いくつかの手順が必要です。これには、従属変数と独立変数のデータポイント(観測値)を取得し、多くの場合回帰モデルから最適な線を見つけることが含まれます。そこから、予測値を計算し、実際の値を減算して、結果を2乗します。これにより、エラーの2乗のリストが生成され、それが合計されて、説明のつかない分散と等しくなります。
全分散を計算するには、各実際の値から平均の実際の値を減算し、結果を2乗して合計します。そこから、最初の誤差の合計(説明された分散)を2番目の合計(合計分散)で割り、その結果を1から引くと、決定係数が得られます。
##R-Squaredが教えてくれること
投資において、R-squaredは一般に、ベンチマークインデックスの動きによって説明できるファンドまたは証券の動きのパーセンテージとして解釈されます。たとえば、債券インデックスと債券インデックスの決定係数は、インデックスの価格変動に基づいて予測可能な証券の価格変動の割合を識別します。
同じことが、S&P 500インデックス、またはその他の関連するインデックスに対する株式にも適用できます。これは、決定係数としても知られています。
決定係数の値の範囲は0から1で、通常は0%から100%のパーセンテージで表されます。 100%の決定係数は、証券(または別の従属変数)のすべての動きが、インデックス(または関心のある独立変数)の動きによって完全に説明されることを意味します。
投資において、85%から100%の間の高い決定係数は、株式またはファンドのパフォーマンスがインデックスと比較的一致していることを示します。決定係数が70%以下と低いファンドは、証券が一般的に指数の動きに従わないことを示しています。決定係数の値が高いほど、ベータ値がより有用であることを示します。たとえば、株式またはファンドの決定係数の値が100%に近いが、ベータが1未満の場合、リスク調整後のリターンが高くなる可能性があります。
##R-Squaredと調整済みR-Squared
R-Squaredは、1つの説明変数を持つ単純な線形回帰モデルで意図したとおりにのみ機能します。いくつかの独立変数で構成される重回帰では、決定係数を調整する必要があります。
調整済み決定係数は、さまざまな数の予測子を含む回帰モデルの記述力を比較します。モデルに追加されたすべての予測子は、決定係数を増加させ、減少させることはありません。したがって、より多くの項を持つモデルは、より多くの項があるという事実だけに適しているように見えるかもしれませんが、調整されたR-squaredは変数の追加を補正し、新しい項がモデルを拡張する場合にのみ増加します。確率によって取得され、予測子が偶然に予測されたものよりもモデルを強化すると減少します。
過剰適合状態では、モデルの予測能力が実際に低下している場合でも、R-squaredの値が誤って高くなります。これは、調整済み決定係数には当てはまりません。
R-Squared vs. Beta
ベータと決定係数は2つの関連しているが異なる相関の尺度ですが、ベータは相対的なリスクの尺度です。決定係数が高いミューチュアルファンドは、ベンチマークと高い相関関係があります。ベータも高い場合、特に強気市場では、ベンチマークよりも高いリターンを生み出す可能性があります。 R-squaredは、資産の価格の各変化がベンチマークとどの程度密接に相関しているかを測定します。
ベータは、これらの価格変動がベンチマークと比較してどれだけ大きいかを測定します。 R-squaredとベータを一緒に使用すると、投資家は資産運用会社のパフォーマンスの全体像を把握できます。正確に1.0のベータは、資産のリスク(ボラティリティ)がベンチマークのリスク(ボラティリティ)と同じであることを意味します。本質的に、決定係数は、証券のベータの実用性と信頼性のための統計分析手法です。
##決定係数の制限
決定係数は、独立変数の動きに基づいて、従属変数の動き間の関係の推定値を提供します。選択したモデルが良いか悪いかはわかりません。また、データと予測に偏りがあるかどうかもわかりません。決定係数が高いか低いかは、モデルの信頼性や正しい回帰を選択したかどうかを伝えないため、必ずしも良いか悪いかではありません。良いモデルの場合は低いR-squareを取得でき、適合性の低いモデルの場合は高いR-squareを取得できます。その逆も可能です。
##ハイライト
-R-Squaredは、回帰モデルの独立変数によって従属変数の変動がどの程度説明されるかを示す、適合の統計的尺度です。
-投資において、R-squaredは一般に、ベンチマークインデックスの動きによって説明できるファンドまたは証券の動きのパーセンテージとして解釈されます。
-100%の決定係数は、証券(または他の従属変数)のすべての動きが、インデックス(または関心のある独立変数)の動きによって完全に説明されることを意味します。
## よくある質問
###良い決定係数とは何ですか?
「適切な」決定係数値として適格なものは、コンテキストによって異なります。社会科学などの一部の分野では、0.5などの比較的低い決定係数でさえ比較的強いと見なすことができます。他の分野では、良好なR-Squared読み取りの基準は、0.9以上など、はるかに高くなる可能性があります。金融では、0.7を超える決定係数は一般に高レベルの相関を示すと見なされますが、0.4を下回る測定値は低い相関を示します。ただし、これは難しいルールではなく、特定の分析によって異なります。
0.9の決定係数値はどういう意味ですか?
基本的に、R-Squared値が0.9の場合、調査対象の従属変数の分散の90%が独立変数の分散によって説明されることを示します。たとえば、ミューチュアルファンドのR-Squared値がベンチマークに対して0.9である場合、ファンドの分散の90%がベンチマークインデックスの分散によって説明されることを示します。
###決定係数が高いほど良いですか?
ここでも、コンテキストによって異なります。特定のインデックスを可能な限り追跡するインデックスファンドを探しているとします。そのシナリオでは、ファンドのR-Squaredをできるだけ高くする必要があります。これは、その目標がインデックスを超えるのではなく、一致させることであるためです。一方、アクティブに管理されているファンドを探している場合、高いR-Squaredは悪い兆候と見なされる可能性があります。これは、ファンドのマネージャーがベンチマークに対して十分な価値を追加していないことを示しています。