Investor's wiki

비모수적 방법

비모수적 방법

λΉ„λͺ¨μˆ˜μ  λ°©λ²•μ΄λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

λΉ„λͺ¨μˆ˜μ  방법은 ν‘œλ³Έμ˜ νŠΉμ„±(λͺ¨μˆ˜)μ΄λ‚˜ κ΄€μ°°λœ 데이터가 양적인지 정성적인지에 λŒ€ν•΄ κ°€μ •ν•˜μ§€ μ•ŠλŠ” 톡계 μœ ν˜•μ„ λ§ν•©λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜ ν†΅κ³„μ—λŠ” νŠΉμ • 기술 톡계,. 톡계 λͺ¨λΈ, μΆ”λ‘  및 톡계 ν…ŒμŠ€νŠΈκ°€ 포함될 수 μžˆμŠ΅λ‹ˆλ‹€. λΉ„λͺ¨μˆ˜μ  λ°©λ²•μ˜ λͺ¨λΈ κ΅¬μ‘°λŠ” μ„ ν—˜μ μœΌλ‘œ μ§€μ •λ˜μ§€ μ•Šκ³  λŒ€μ‹  λ°μ΄ν„°μ—μ„œ κ²°μ •λ©λ‹ˆλ‹€.

"λΉ„λͺ¨μˆ˜μ "μ΄λΌλŠ” μš©μ–΄λŠ” κ·ΈλŸ¬ν•œ λͺ¨λΈμ— λ§€κ°œλ³€μˆ˜κ°€ μ™„μ „νžˆ μ—†μŒμ„ μ˜λ―Έν•˜λŠ” 것이 μ•„λ‹ˆλΌ λ§€κ°œλ³€μˆ˜μ˜ μˆ˜μ™€ νŠΉμ„±μ΄ μœ μ—°ν•˜κ³  사전에 κ³ μ •λ˜μ–΄ μžˆμ§€ μ•ŠμŒμ„ μ˜λ―Έν•©λ‹ˆλ‹€. νžˆμŠ€ν† κ·Έλž¨μ€ ν™•λ₯  λΆ„ν¬μ˜ λΉ„λͺ¨μˆ˜ μΆ”μ •μΉ˜μ˜ μ˜ˆμž…λ‹ˆλ‹€.

λŒ€μ‘°μ μœΌλ‘œ, ANOVA,. Pearson's correlation,. t-test λ“±κ³Ό 같은 잘 μ•Œλ €μ§„ 톡계 방법 은 λΆ„μ„λ˜λŠ” 데이터에 λŒ€ν•΄ 가정을 ν•©λ‹ˆλ‹€. κ°€μž₯ 일반적인 λͺ¨μˆ˜μ  κ°€μ • 쀑 ν•˜λ‚˜λŠ” λͺ¨μ§‘단 데이터에 " μ •κ·œ 뢄포 "κ°€ μžˆλ‹€λŠ” 것 μž…λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜μ  λ°©λ²•μ˜ μž‘λ™ 원리

λͺ¨μˆ˜ 및 λΉ„λͺ¨μˆ˜ 방법은 μ’…μ’… λ‹€λ₯Έ μœ ν˜•μ˜ 데이터에 μ‚¬μš©λ©λ‹ˆλ‹€. λͺ¨μˆ˜ ν†΅κ³„μ—λŠ” 일반적으둜 간격 λ˜λŠ” λΉ„μœ¨ 데이터가 ν•„μš”ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ μœ ν˜•μ˜ λ°μ΄ν„°μ˜ μ˜ˆλ‘œλŠ” 값이 연속적이고 κ°’ μ‚¬μ΄μ˜ 간격이 의미λ₯Ό κ°–λŠ” μ—°λ Ή, μ†Œλ“, ν‚€, 체쀑이 μžˆμŠ΅λ‹ˆλ‹€.

λŒ€μ‘°μ μœΌλ‘œ, λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” 일반적으둜 λͺ…λͺ© λ˜λŠ” μ„œμˆ˜ 데이터에 μ‚¬μš©λ©λ‹ˆλ‹€. λͺ…λͺ© λ³€μˆ˜λŠ” 값이 μ •λŸ‰μ  값이 μ•„λ‹Œ λ³€μˆ˜μž…λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄ μ‚¬νšŒ κ³Όν•™ μ—°κ΅¬μ—μ„œ 일반적인 λͺ…λͺ© λ³€μˆ˜μ—λŠ” 성별이 ν¬ν•¨λ˜λ©° κ°€λŠ₯ν•œ 값은 이산 범주인 "남성"κ³Ό "μ—¬μ„±"μž…λ‹ˆλ‹€.' μ‚¬νšŒ κ³Όν•™ μ—°κ΅¬μ˜ λ‹€λ₯Έ 일반적인 λͺ…λͺ© λ³€μˆ˜λŠ” 인쒅, 결혼 μƒνƒœ, ꡐ윑 μˆ˜μ€€ 고용 μƒνƒœ(고용 λŒ€ μ‹€μ—…).

μˆœμ„œ λ³€μˆ˜λŠ” 값이 μ–΄λ–€ μˆœμ„œλ₯Ό μ œμ•ˆν•˜λŠ” λ³€μˆ˜μž…λ‹ˆλ‹€. μ„œμˆ˜ λ³€μˆ˜μ˜ μ˜ˆλŠ” μ„€λ¬Έ μ‘λ‹΅μžκ°€ "1μ—μ„œ 5κΉŒμ§€μ˜ μ²™λ„μ—μ„œ 1이 맀우 뢈만쑱, 5κ°€ 맀우 만쑱인 경우 케이블 νšŒμ‚¬μ— λŒ€ν•œ κ·€ν•˜μ˜ κ²½ν—˜μ„ μ–΄λ–»κ²Œ ν‰κ°€ν•˜μ‹œκ² μŠ΅λ‹ˆκΉŒ?"라고 λ¬»λŠ” κ²½μš°μž…λ‹ˆλ‹€.

λͺ¨μˆ˜ 톡계 λŠ” μ•Œλ €μ§„ 뢄포 μœ ν˜•μ΄ μžˆλŠ” λͺ¨μ§‘단에도 적용될 수 μžˆμŠ΅λ‹ˆλ‹€. λΉ„λͺ¨μˆ˜ ν†΅κ³„μ—μ„œλŠ” λͺ¨μ§‘단 데이터가 λͺ¨μˆ˜ 톡계에 ν•„μš”ν•œ 가정을 μΆ©μ‘±ν•  ν•„μš”κ°€ μ—†μŠ΅λ‹ˆλ‹€. λ”°λΌμ„œ λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” 뢄포가 μ—†λŠ” 톡계 범주에 μ†ν•©λ‹ˆλ‹€. λͺ¨μ§‘단 데이터에 μ•Œ 수 μ—†λŠ” 뢄포가 μžˆκ±°λ‚˜ ν‘œλ³Έ 크기가 μž‘μ€ κ²½μš°μ—λŠ” μ’…μ’… λΉ„λͺ¨μˆ˜μ  방법이 μ‚¬μš©λ©λ‹ˆλ‹€.

νŠΉλ³„ κ³ λ € 사항

λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” λͺ‡ 가지 가정을 μΆ©μ‘±ν•΄μ•Ό ν•˜λŠ” 이점이 μžˆμ§€λ§Œ λͺ¨μˆ˜ 톡계보닀 덜 κ°•λ ₯ν•©λ‹ˆλ‹€. 이것은 μ‹€μ œλ‘œ ν•˜λ‚˜κ°€ μ‘΄μž¬ν•˜λŠ” 경우 두 λ³€μˆ˜ μ‚¬μ΄μ˜ 관계λ₯Ό ν‘œμ‹œν•˜μ§€ μ•Šμ„ 수 μžˆμŒμ„ μ˜λ―Έν•©λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” μ‚¬μš© μš©μ΄μ„±μœΌλ‘œ 인해 높이 ν‰κ°€λ˜μ—ˆμŠ΅λ‹ˆλ‹€. λ§€κ°œλ³€μˆ˜μ— λŒ€ν•œ ν•„μš”μ„±μ΄ 완화됨에 따라 λ°μ΄ν„°λŠ” 더 λ‹€μ–‘ν•œ ν…ŒμŠ€νŠΈμ— μ μš©ν•  수 있게 λ˜μ—ˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ μœ ν˜•μ˜ ν†΅κ³„λŠ” ν•΄λ‹Ή 정보λ₯Ό μ‚¬μš©ν•  수 μ—†λŠ” 경우 평균, ν‘œλ³Έ 크기, ν‘œμ€€ 편차 λ˜λŠ” 기타 κ΄€λ ¨ λ§€κ°œλ³€μˆ˜μ˜ μΆ”μ • 없이 μ‚¬μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” ν‘œλ³Έ 데이터에 λŒ€ν•΄ 더 적은 가정을 ν•˜λ―€λ‘œ 적용 λ²”μœ„κ°€ λͺ¨μˆ˜ 톡계보닀 더 λ„“μŠ΅λ‹ˆλ‹€. λͺ¨μˆ˜ ν…ŒμŠ€νŠΈκ°€ 더 μ μ ˆν•œ 경우 λΉ„λͺ¨μˆ˜ 방법은 덜 νš¨μœ¨μ μž…λ‹ˆλ‹€. λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” λͺ¨μˆ˜ 톡계와 달리 λ°μ΄ν„°μ—μ„œ μ‚¬μš©ν•  수 μžˆλŠ” 일뢀 정보λ₯Ό 버리기 λ•Œλ¬Έμž…λ‹ˆλ‹€.

일반적인 λΉ„λͺ¨μˆ˜ κ²€μ •μ—λŠ” 카이제곱,. Wilcoxon μˆœμœ„ ν•© κ²€μ •,. Kruskal-Wallis κ²€μ • 및 Spearman의 μˆœμœ„ 상관 관계가 ν¬ν•¨λ©λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜μ  λ°©λ²•μ˜ 예

μœ„ν—˜ κ°€μΉ˜ (VaR) λ₯Ό μΆ”μ •ν•˜λ €λŠ” 재무 뢄석가λ₯Ό 생각해 λ³΄μ‹­μ‹œμ˜€ . λΆ„μ„κ°€λŠ” μœ μ‚¬ν•œ κΈ°κ°„ λ™μ•ˆ 수백 개의 μœ μ‚¬ν•œ νˆ¬μžμ—μ„œ 수읡 데이터λ₯Ό μˆ˜μ§‘ν•©λ‹ˆλ‹€. μˆ˜μž…μ΄ μ •κ·œ 뢄포λ₯Ό λ”°λ₯Έλ‹€κ³  κ°€μ •ν•˜λŠ” λŒ€μ‹  νžˆμŠ€ν† κ·Έλž¨μ„ μ‚¬μš©ν•˜μ—¬ 뢄포λ₯Ό λΉ„λͺ¨μˆ˜μ μœΌλ‘œ μΆ”μ •ν•©λ‹ˆλ‹€. 이 νžˆμŠ€ν† κ·Έλž¨μ˜ 5번째 λ°±λΆ„μœ„μˆ˜λŠ” λΆ„μ„κ°€μ—κ²Œ VaR의 λΉ„λͺ¨μˆ˜ μΆ”μ •μΉ˜λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.

두 번째 예λ₯Ό λ“€μ–΄, 평균 수면 μ‹œκ°„μ΄ μ§ˆλ³‘μ— κ±Έλ¦¬λŠ” λΉˆλ„μ™€ 관련이 μžˆλŠ”μ§€ μ•Œκ³  μ‹Άμ–΄ν•˜λŠ” λ‹€λ₯Έ 연ꡬ원을 생각해 λ³΄μ‹­μ‹œμ˜€. λ§Žμ€ μ‚¬λžŒλ“€μ΄ 거의 병에 κ±Έλ¦¬λŠ” κ²½μš°κ°€ 거의 μ—†κ³  κ°„ν˜Ή λ‹€λ₯Έ μ‚¬λžŒλ“€μ΄ λŒ€λΆ€λΆ„μ˜ λ‹€λ₯Έ μ‚¬λžŒλ“€λ³΄λ‹€ 훨씬 더 자주 병에 걸리기 λ•Œλ¬Έμ— μ§ˆλ³‘ λΉˆλ„μ˜ λΆ„ν¬λŠ” λΆ„λͺ…νžˆ 비정상적이며 였λ₯Έμͺ½μœΌλ‘œ 치우쳐 있고 이상값 κ²½ν–₯이 μžˆμŠ΅λ‹ˆλ‹€.

λ”°λΌμ„œ μ—°κ΅¬μžλŠ” 예λ₯Ό λ“€μ–΄ 고전적 νšŒκ·€ λΆ„μ„μ—μ„œμ™€ 같이 μ§ˆλ³‘ λΉˆλ„μ— λŒ€ν•œ μ •κ·œ 뢄포λ₯Ό κ°€μ •ν•˜λŠ” 방법을 μ‚¬μš©ν•˜λŠ” λŒ€μ‹  λΆ„μœ„μˆ˜ νšŒκ·€ 뢄석과 같은 λΉ„λͺ¨μˆ˜μ  방법을 μ‚¬μš©ν•˜κΈ°λ‘œ κ²°μ •ν•©λ‹ˆλ‹€.

##ν•˜μ΄λΌμ΄νŠΈ

  • μ΄λŠ” λ°μ΄ν„°μ˜ ν˜•νƒœλ‚˜ νŠΉμ„±μ„ κ°€μ •ν•˜λŠ” νŒŒλΌλ©”νŠΈλ¦­ 방식과 λŒ€μ‘°μ μž…λ‹ˆλ‹€. μ΄λŸ¬ν•œ λ°©λ²•μ˜ μ˜ˆλ‘œλŠ” μ •κ·œ 뢄포 λͺ¨λΈκ³Ό μ„ ν˜• νšŒκ·€ λͺ¨λΈμ΄ μžˆμŠ΅λ‹ˆλ‹€.

  • λΉ„λͺ¨μˆ˜μ  방법은 데이터가 적은 수의 λ§€κ°œλ³€μˆ˜μ— μ˜ν•΄ κ²°μ •λ˜λŠ” κ·œμ •λœ λͺ¨λΈμ—μ„œ λ‚˜μ˜¨ κ²ƒμœΌλ‘œ κ°€μ •ν•˜μ§€ μ•ŠλŠ” ν†΅κ³„μ˜ ν•œ λΆ„μ•Όμž…λ‹ˆλ‹€.

  • λΉ„λͺ¨μˆ˜ 뢄석은 수치 데이터가 λ³€κ²½λ˜λ”λΌλ„ κ²°κ³Όκ°€ λ™μΌν•˜κ²Œ μœ μ§€λ  κ°€λŠ₯성이 높은 μˆœμ„œλ₯Ό κ³ λ €ν•  λ•Œ μ’…μ’… κ°€μž₯ μ ν•©ν•©λ‹ˆλ‹€.