Investor's wiki

ノンパラメトリック統計

ノンパラメトリック統計

##ノンパラメトリック統計とは何ですか?

ノンパラメトリック統計とは、データが少数のパラメーターによって決定される所定のモデルからのものであると想定されていない統計手法を指します。このようなモデルの例には、正規分布モデルと線形回帰モデルが含まれます。ノンパラメトリック統計では、序数のデータが使用されることがあります。つまり、数値ではなく、ランク付けや並べ替えの順序に依存します。たとえば、好きなものから嫌いなものまでの範囲の消費者の好みを伝える調査は、順序データと見なされます。

ノンパラメトリック統計には、ノンパラメトリック記述統計、統計モデル、推論、および統計検定が含まれます。ノンパラメトリックモデルのモデル構造は事前に指定されていませんが、代わりにデータから決定されます。 ノンパラメトリックという用語は、そのようなモデルにパラメーターが完全にないことを意味するのではなく、パラメーターの数と性質が柔軟であり、事前に固定されていないことを意味します。ヒストグラムは、確率分布のノンパラメトリック推定の例です。

##ノンパラメトリック統計を理解する

統計では、パラメトリック統計には、平均、標準偏差、ピアソン相関、分散などのパラメーターが含まれます。この形式の統計では、観測データを使用して分布のパラメーターを推定します。パラメトリック統計では、データは未知のパラメーターμ(母平均)とσ2(母分散)を持つ正規分布から得られると想定されることが多く、これらはサンプル平均とサンプル分散を使用して推定されます。

ノンパラメトリック統計は、サンプルサイズや、観測されたデータが定量的であるかどうかについての仮定を行いません。

ノンパラメトリック統計は、データが正規分布から抽出されることを前提とはしていません。代わりに、分布の形はこの形式の統計的測定の下で推定されます。正規分布を想定できる状況はたくさんありますが、真のデータ生成プロセスが正規分布からかけ離れているシナリオもあります。

##ノンパラメトリック統計の例

最初の例では、投資のバリューアットリスク(VaR)を推定したい金融アナリストについて考えてみます。アナリストは、同様の期間にわたる数百の同様の投資から収益データを収集します。収益が正規分布に従うと想定するのではなく、ヒストグラムを使用して非パラメトリックに分布を推定します。次に、このヒストグラムの5パーセンタイルは、VaRのノンパラメトリック推定をアナリストに提供します。

2番目の例として、平均睡眠時間が病気になる頻度に関連しているかどうかを知りたい別の研究者を考えてみましょう。多くの人が病気になることはめったになく、たまに他の人よりもはるかに頻繁に病気になるため、病気の頻度の分布は明らかに異常であり、右に歪んで外れ値になりがちです。したがって、たとえば、古典的な回帰分析で行われるように、病気の頻度の正規分布を想定する方法を使用するのではなく、研究者は、分位点回帰分析などのノンパラメトリック法を使用することにします。

##特別な考慮事項

ノンパラメトリック統計は、その使いやすさから評価を得ています。パラメータの必要性が軽減されると、データはより多様なテストに適用できるようになります。このタイプの統計は、平均、サンプルサイズ、標準偏差、またはその他の関連パラメーターの推定なしで、その情報が利用できない場合に使用できます。

ノンパラメトリック統計はサンプルデータに関する仮定が少ないため、その適用範囲はパラメトリック統計よりも広くなります。パラメトリック検定がより適切な場合、ノンパラメトリック手法は効率が低下します。これは、ノンパラメトリック統計は、パラメトリック統計とは異なり、データで利用可能な一部の情報を破棄するためです。

##ハイライト

-このタイプの分析は、数値データが変更されても結果が同じままである可能性が高い、何かの順序を検討する場合に最も適していることがよくあります。

-ノンパラメトリック統計は使いやすいですが、他の統計モデルの正確さを提供しません。