Investor's wiki

비모수 통계

비모수 통계

λΉ„λͺ¨μˆ˜ ν†΅κ³„λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” 데이터가 μ†Œμˆ˜μ˜ λ§€κ°œλ³€μˆ˜μ— μ˜ν•΄ κ²°μ •λ˜λŠ” κ·œμ •λœ λͺ¨λΈμ—μ„œ λ‚˜μ˜¨ κ²ƒμœΌλ‘œ κ°€μ •ν•˜μ§€ μ•ŠλŠ” 톡계적 방법을 λ§ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ λͺ¨λΈμ˜ μ˜ˆλ‘œλŠ” μ •κ·œ 뢄포 λͺ¨λΈκ³Ό μ„ ν˜• νšŒκ·€ λͺ¨λΈμ΄ μžˆμŠ΅λ‹ˆλ‹€. λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” λ•Œλ•Œλ‘œ μˆœμ„œν˜• 데이터λ₯Ό μ‚¬μš©ν•©λ‹ˆλ‹€. 즉, μˆ«μžμ— μ˜μ‘΄ν•˜μ§€ μ•Šκ³  μˆœμœ„λ‚˜ μ •λ ¬ μˆœμ„œμ— μ˜μ‘΄ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, μ’‹μ•„ν•˜λŠ” 것뢀터 μ‹«μ–΄ν•˜λŠ” κ²ƒκΉŒμ§€ μ†ŒλΉ„μž μ„ ν˜Έλ„λ₯Ό μ „λ‹¬ν•˜λŠ” μ„€λ¬Έμ‘°μ‚¬λŠ” μˆœμ„œν˜• λ°μ΄ν„°λ‘œ κ°„μ£Όλ©λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜ ν†΅κ³„μ—λŠ” λΉ„λͺ¨μˆ˜ 기술 톡계,. 톡계 λͺ¨λΈ, μΆ”λ‘  및 톡계 ν…ŒμŠ€νŠΈκ°€ ν¬ν•¨λ©λ‹ˆλ‹€. λΉ„λͺ¨μˆ˜ λͺ¨λΈμ˜ λͺ¨λΈ κ΅¬μ‘°λŠ” μ„ ν—˜μ μœΌλ‘œ μ§€μ •λ˜μ§€ μ•Šκ³  λŒ€μ‹  λ°μ΄ν„°μ—μ„œ κ²°μ •λ©λ‹ˆλ‹€. λΉ„λͺ¨μˆ˜λΌλŠ” μš©μ–΄λŠ” μ΄λŸ¬ν•œ λͺ¨λΈμ— λ§€κ°œλ³€μˆ˜κ°€ μ™„μ „νžˆ μ—†μŒμ„ μ˜λ―Έν•˜λŠ” 것이 μ•„λ‹ˆλΌ λ§€κ°œλ³€μˆ˜μ˜ μˆ˜μ™€ νŠΉμ„±μ΄ μœ μ—°ν•˜κ³  사전에 κ³ μ •λ˜μ–΄ μžˆμ§€ μ•Šλ‹€λŠ” μ˜λ―Έμž…λ‹ˆλ‹€. νžˆμŠ€ν† κ·Έλž¨μ€ ν™•λ₯  λΆ„ν¬μ˜ λΉ„λͺ¨μˆ˜ μΆ”μ •μΉ˜μ˜ μ˜ˆμž…λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜ 톡계 이해

ν†΅κ³„μ—μ„œ λͺ¨μˆ˜ ν†΅κ³„μ—λŠ” 평균, ν‘œμ€€ 편차, ν”Όμ–΄μŠ¨ 상관 관계, λΆ„μ‚° λ“±κ³Ό 같은 맀개 λ³€μˆ˜κ°€ ν¬ν•¨λ©λ‹ˆλ‹€. 이 ν˜•νƒœμ˜ ν†΅κ³„λŠ” κ΄€μ°°λœ 데이터λ₯Ό μ‚¬μš©ν•˜μ—¬ λΆ„ν¬μ˜ λ§€κ°œλ³€μˆ˜λ₯Ό μΆ”μ •ν•©λ‹ˆλ‹€. λͺ¨μˆ˜ ν†΅κ³„μ—μ„œ λ°μ΄ν„°λŠ” μ’…μ’… λͺ¨μˆ˜ ΞΌ(인ꡬ 평균)와 Οƒ2(인ꡬ λΆ„μ‚°)λ₯Ό μ•Œ 수 μ—†λŠ” μ •κ·œ λΆ„ν¬μ—μ„œ κ°€μ Έμ˜¨ κ²ƒμœΌλ‘œ κ°€μ •ν•œ λ‹€μŒ ν‘œλ³Έ 평균과 ν‘œλ³Έ 뢄산을 μ‚¬μš©ν•˜μ—¬ μΆ”μ •ν•©λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” ν‘œλ³Έ ν¬κΈ°λ‚˜ κ΄€μ°°λœ 데이터가 μ •λŸ‰μ μΈμ§€ μ—¬λΆ€λ₯Ό κ°€μ •ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” 데이터가 μ •κ·œ λΆ„ν¬μ—μ„œ μΆ”μΆœλ˜μ—ˆλ‹€κ³  κ°€μ •ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. λŒ€μ‹  μ΄λŸ¬ν•œ ν˜•νƒœμ˜ 톡계적 μΈ‘μ •μœΌλ‘œ λΆ„ν¬μ˜ ν˜•νƒœλ₯Ό μΆ”μ •ν•œλ‹€. μ •κ·œ 뢄포λ₯Ό κ°€μ •ν•  수 μžˆλŠ” 상황이 많이 μžˆμ§€λ§Œ μ‹€μ œ 데이터 생성 ν”„λ‘œμ„ΈμŠ€κ°€ μ •κ·œ 뢄포와 거리가 λ¨Ό μ‹œλ‚˜λ¦¬μ˜€λ„ μžˆμŠ΅λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜ ν†΅κ³„μ˜ 예

첫 번째 μ˜ˆμ—μ„œ 투자의 μœ„ν—˜ κ°€μΉ˜(VaR)λ₯Ό μΆ”μ •ν•˜λ €λŠ” 재무 뢄석가λ₯Ό 생각해 λ³΄μ‹­μ‹œμ˜€. λΆ„μ„κ°€λŠ” μœ μ‚¬ν•œ κΈ°κ°„ λ™μ•ˆ 100개 μ΄μƒμ˜ μœ μ‚¬ν•œ νˆ¬μžμ—μ„œ 수읡 데이터λ₯Ό μˆ˜μ§‘ν•©λ‹ˆλ‹€. μˆ˜μž…μ΄ μ •κ·œ 뢄포λ₯Ό λ”°λ₯Έλ‹€κ³  κ°€μ •ν•˜λŠ” λŒ€μ‹  νžˆμŠ€ν† κ·Έλž¨μ„ μ‚¬μš©ν•˜μ—¬ 뢄포λ₯Ό λΉ„λͺ¨μˆ˜μ μœΌλ‘œ μΆ”μ •ν•©λ‹ˆλ‹€. 이 νžˆμŠ€ν† κ·Έλž¨μ˜ 5번째 λ°±λΆ„μœ„μˆ˜λŠ” λΆ„μ„κ°€μ—κ²Œ VaR의 λΉ„λͺ¨μˆ˜ μΆ”μ •μΉ˜λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.

두 번째 예λ₯Ό λ“€μ–΄, 평균 수면 μ‹œκ°„μ΄ μ§ˆλ³‘μ— κ±Έλ¦¬λŠ” λΉˆλ„μ™€ 관련이 μžˆλŠ”μ§€ μ—¬λΆ€λ₯Ό μ•Œκ³  μ‹Άμ–΄ν•˜λŠ” λ‹€λ₯Έ 연ꡬ원을 생각해 λ³΄μ‹­μ‹œμ˜€. λ§Žμ€ μ‚¬λžŒλ“€μ΄ 거의 병에 κ±Έλ¦¬λŠ” κ²½μš°κ°€ 거의 μ—†κ³  κ°„ν˜Ή λ‹€λ₯Έ μ‚¬λžŒλ“€μ΄ λŒ€λΆ€λΆ„μ˜ λ‹€λ₯Έ μ‚¬λžŒλ“€λ³΄λ‹€ 훨씬 더 자주 병에 걸리기 λ•Œλ¬Έμ— μ§ˆλ³‘ λΉˆλ„μ˜ λΆ„ν¬λŠ” λΆ„λͺ…νžˆ 비정상적이며 였λ₯Έμͺ½μœΌλ‘œ 치우쳐 있고 이상값 κ²½ν–₯이 μžˆμŠ΅λ‹ˆλ‹€. λ”°λΌμ„œ μ—°κ΅¬μžλŠ” 예λ₯Ό λ“€μ–΄ 고전적 νšŒκ·€ λΆ„μ„μ—μ„œμ™€ 같이 μ§ˆλ³‘ λΉˆλ„μ— λŒ€ν•œ μ •κ·œ 뢄포λ₯Ό κ°€μ •ν•˜λŠ” 방법을 μ‚¬μš©ν•˜λŠ” λŒ€μ‹  λΆ„μœ„μˆ˜ νšŒκ·€ 뢄석과 같은 λΉ„λͺ¨μˆ˜μ  방법을 μ‚¬μš©ν•˜κΈ°λ‘œ κ²°μ •ν•©λ‹ˆλ‹€.

νŠΉλ³„ κ³ λ € 사항

λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” μ‚¬μš© μš©μ΄μ„±μœΌλ‘œ 인해 높이 ν‰κ°€λ˜μ—ˆμŠ΅λ‹ˆλ‹€. λ§€κ°œλ³€μˆ˜μ— λŒ€ν•œ ν•„μš”μ„±μ΄ 완화됨에 따라 λ°μ΄ν„°λŠ” 더 λ‹€μ–‘ν•œ ν…ŒμŠ€νŠΈμ— μ μš©ν•  수 있게 λ˜μ—ˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ μœ ν˜•μ˜ ν†΅κ³„λŠ” ν•΄λ‹Ή 정보λ₯Ό μ‚¬μš©ν•  수 μ—†λŠ” 경우 평균, ν‘œλ³Έ 크기, ν‘œμ€€ 편차 λ˜λŠ” 기타 κ΄€λ ¨ λ§€κ°œλ³€μˆ˜μ˜ μΆ”μ • 없이 μ‚¬μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” ν‘œλ³Έ 데이터에 λŒ€ν•΄ 더 적은 가정을 ν•˜λ―€λ‘œ 적용 λ²”μœ„κ°€ λͺ¨μˆ˜ 톡계보닀 더 λ„“μŠ΅λ‹ˆλ‹€. λͺ¨μˆ˜ ν…ŒμŠ€νŠΈκ°€ 더 μ μ ˆν•œ 경우 λΉ„λͺ¨μˆ˜ 방법은 덜 νš¨μœ¨μ μž…λ‹ˆλ‹€. λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” λͺ¨μˆ˜ 톡계와 달리 λ°μ΄ν„°μ—μ„œ μ‚¬μš©ν•  수 μžˆλŠ” 일뢀 정보λ₯Ό 버리기 λ•Œλ¬Έμž…λ‹ˆλ‹€.

##ν•˜μ΄λΌμ΄νŠΈ

  • μ΄λŸ¬ν•œ μœ ν˜•μ˜ 뢄석은 숫자 데이터가 λ³€κ²½λ˜λ”λΌλ„ κ²°κ³Όκ°€ λ™μΌν•˜κ²Œ μœ μ§€λ  κ°€λŠ₯성이 높은 μˆœμ„œλ₯Ό κ³ λ €ν•  λ•Œ κ°€μž₯ μ ν•©ν•©λ‹ˆλ‹€.

  • λΉ„λͺ¨μˆ˜ ν†΅κ³„λŠ” μ‚¬μš©ν•˜κΈ° μ‰½μ§€λ§Œ λ‹€λ₯Έ 톡계 λͺ¨λΈμ˜ μ •ν™•ν•œ 정확도λ₯Ό μ œκ³΅ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€.