Investor's wiki

ノンパラメトリック法

ノンパラメトリック法

##ノンパラメトリック法とは何ですか?

ノンパラメトリック法とは、サンプルの特性(そのパラメーター)や、観測されたデータが定量的であるか定性的であるかについての仮定を行わないタイプの統計を指します。

ノンパラメトリック統計には、特定の記述統計、統計モデル、推論、および統計検定を含めることができます。ノンパラメトリック手法のモデル構造は事前に指定されていませんが、代わりにデータから決定されます。

「ノンパラメトリック」という用語は、そのようなモデルが完全にパラメーターを欠いていることを意味するのではなく、パラメーターの数と性質が柔軟であり、事前に固定されていないことを意味します。ヒストグラムは、確率分布のノンパラメトリック推定の例です。

対照的に、 ANOVAピアソンの相関t検定などのよく知られた統計手法は、分析されるデータについて仮定を行います。最も一般的なパラメトリックな仮定の1つは、母集団データが「正規分布」を持っているということです。

##ノンパラメトリック法のしくみ

パラメトリック法とノンパラメトリック法は、さまざまなタイプのデータでよく使用されます。パラメトリック統計には通常、間隔または比率のデータが必要です。このタイプのデータの例は、年齢、収入、身長、体重であり、値は連続しており、値の間隔には意味があります。

対照的に、ノンパラメトリック統計は通常、名目または順序のデータで使用されます。名目変数は、値が定量的な値を持たない変数です。たとえば、社会科学研究における一般的な名目変数には、性別が含まれ、その可能な値は、「男性」と「女性」の個別のカテゴリです。社会科学研究におけるその他の一般的な名目変数は、人種、婚姻状況、教育レベル、および雇用状況(雇用者と非雇用者)。

順序変数は、値が何らかの順序を示唆する変数です。順序変数の例は、調査回答者が「1から5のスケールで、1は非常に不満、5は非常に満足です。ケーブル会社での経験をどのように評価しますか?」と尋ねた場合です。

パラメトリック統計は、他の既知の分布タイプの母集団にも適用される場合があります。ノンパラメトリック統計では、母集団データがパラメトリック統計に必要な仮定を満たす必要はありません。したがって、ノンパラメトリック統計は、分布なしと呼ばれることもある統計のカテゴリに分類されます。母集団データの分布が不明な場合、またはサンプルサイズが小さい場合は、ノンパラメトリック手法が使用されることがよくあります。

##特別な考慮事項

ノンパラメトリック統計には、いくつかの仮定を満たさなければならないという利点がありますが、パラメトリック統計ほど強力ではありません。これは、実際には1つが存在する場合でも、2つの変数間の関係を示さない可能性があることを意味します。

ノンパラメトリック統計は、その使いやすさから評価を得ています。パラメータの必要性が軽減されると、データはより多様なテストに適用できるようになります。このタイプの統計は、平均、サンプルサイズ、標準偏差、またはその他の関連パラメーターの推定なしで、その情報が利用できない場合に使用できます。

ノンパラメトリック統計はサンプルデータに関する仮定が少ないため、その適用範囲はパラメトリック統計よりも広くなります。パラメトリック検定がより適切な場合、ノンパラメトリック手法は効率が低下します。これは、ノンパラメトリック統計は、パラメトリック統計とは異なり、データで利用可能な一部の情報を破棄するためです。

一般的なノンパラメトリック検定には、カイ2乗ウィルコクソン順位和検定、クラスカル・ウォリス検定、およびスピアマンの順位相関が含まれます。

##ノンパラメトリック法の例

バリューアットリスク(VaR)を推定したい金融アナリストを考えてみましょう。アナリストは、同様の期間にわたる何百もの同様の投資から収益データを収集します。彼女は、収益が正規分布に従うと想定するのではなく、ヒストグラムを使用して非パラメトリックに分布を推定します。次に、このヒストグラムの5パーセンタイルは、VaRのノンパラメトリック推定をアナリストに提供します。

2番目の例として、平均睡眠時間が病気になる頻度に関連しているかどうかを知りたい別の研究者を考えてみましょう。多くの人が病気になることはめったになく、たまに他の人よりもはるかに頻繁に病気になるため、病気の頻度の分布は明らかに異常であり、右に歪んで外れ値になりがちです。

したがって、たとえば、古典的な回帰分析で行われるように、病気の頻度の正規分布を想定する方法を使用するのではなく、研究者は、分位点回帰分析などのノンパラメトリック法を使用することにします。

##ハイライト

-これは、データの形状や特性について仮定するパラメトリック手法とは対照的です。このような方法の例には、正規分布モデルや線形回帰モデルが含まれます。

-ノンパラメトリック法は、データが少数のパラメーターによって決定される所定のモデルからのものであると想定されていない統計のブランチです。

-ノンパラメトリック分析は、数値データが変更されても結果が同じである可能性が高い、何かの順序を検討する場合に最も適していることがよくあります。