記述統計
##記述統計とは何ですか?
記述統計は、特定のデータセットを要約する簡単な記述係数であり、母集団全体の表現または母集団のサンプルのいずれかです。記述統計は、中心傾向の測定値と変動性の測定値(広がり)に分けられます。中心傾向の測定値には、平均、中央値、および最頻値が含まれ、変動性の測定値には、標準偏差、分散、最小および最大変数、尖度、および歪度が含まれます。
##記述統計を理解する
記述統計は、要するに、データのサンプルと測定値に関する短い要約を提供することにより、特定のデータセットの機能を説明および理解するのに役立ちます。記述統計の最も認識されているタイプは、中心の尺度です。平均、中央値、最頻値であり、数学と統計のほぼすべてのレベルで使用されます。平均または平均は、データセット内のすべての数値を加算し、セット内の数値の数で割ることによって計算されます。
たとえば、次のデータセットの合計は20です:(2、3、4、5、6)。平均は4(20/5)です。データセットの最頻値は最も頻繁に表示される値であり、中央値はデータセットの中央にある数値です。これは、データセット内で上位の数値を下位の数値から分離した数値です。ただし、それでも非常に重要な記述統計の一般的なタイプはあまりありません。
人々は記述統計を使用して、大規模なデータセット全体の理解しにくい定量的洞察を一口サイズの記述に再利用します。たとえば、学生の成績平均点(GPA)は、記述統計の十分な理解を提供します。 GPAの考え方は、さまざまな試験、クラス、成績からデータポイントを取得し、それらを平均して、学生の全体的な学業成績の一般的な理解を提供することです。学生の個人的なGPAは、彼らの平均的な学業成績を反映しています。
##記述統計の種類
すべての記述統計は、中心傾向の測定値または変動性の測定値のいずれかであり、分散の測定値としても知られています。
###中心傾向
中心傾向の測定値はデータセットの平均値または中間値に焦点を当てていますが、変動性の測定値はデータの分散に焦点を当てています。これらの2つの測定値は、グラフ、表、および一般的なディスカッションを使用して、分析されたデータの意味を理解するのに役立ちます。
中心傾向の尺度は、データセットの分布の中心位置を表します。人は、分布内の各データポイントの頻度を分析し、分析されたデータセットの最も一般的なパターンを測定する平均、中央値、または最頻値を使用してそれを説明します。
###変動性の測定
変動性の測定値(または広がりの測定値)は、データセットの分布がどの程度分散しているかを分析するのに役立ちます。たとえば、中心傾向の測定値は、データセットの平均を人に与える可能性がありますが、データがセット内でどのように分散されているかについては説明していません。
したがって、データの平均は100のうち65である可能性がありますが、1と100の両方にデータポイントが存在する可能性があります。変動性の測定値は、データセットの形状と広がりを記述することでこれを伝えるのに役立ちます。範囲、四分位数、絶対偏差、および分散はすべて、変動性の尺度の例です。
次のデータセットについて考えてみます。5、19、24、62、91、100。そのデータセットの範囲は95で、データセットの最小数(5)を最大値(100)から差し引いて計算されます。
##ハイライト
-記述統計は、中心傾向の測定値と変動性(または広がり)の測定値という2つの基本的な測定カテゴリで構成されます。
-記述統計は、データセットの特性を要約または説明します。
-変動性または広がりの尺度は、セット内のデータの分散を表します。
-中心傾向の測定値は、データセットの中心を表します。
##よくある質問
###記述統計を使用して推論または予測を行うことはできますか?
番号。これらの記述はデータ属性の理解に役立ちますが、変数がデータセット内でどのように相互作用するかを理解するには、推論統計手法(統計の別のブランチ)が必要です。
###平均と標準偏差とは何ですか?
これらは、一般的に使用される2つの記述統計です。平均は、あるデータで観察された平均レベルですが、標準偏差は、分散、つまりその変数で観察されたデータがその平均の周りにどの程度分散しているかを表します。
###データを単純に説明する統計が必要なのはなぜですか?
記述統計は、変数の平均、標準偏差、頻度など、サンプルまたはデータセットの特性を記述または要約するために使用されます。推論統計は、データサンプルの要素の集合的なプロパティを理解するのに役立ちます。変数のサンプルの平均、分散、および分布を知ることは、私たちの周りの世界を理解するのに役立ちます。