Investor's wiki

결정 계수

결정 계수

κ²°μ • κ³„μˆ˜λŠ” λ¬΄μ—‡μž…λ‹ˆκΉŒ?

κ²°μ • κ³„μˆ˜λŠ” 주어진 이벀트의 κ²°κ³Όλ₯Ό μ˜ˆμΈ‘ν•  λ•Œ ν•œ λ³€μˆ˜μ˜ 차이λ₯Ό 두 번째 λ³€μˆ˜μ˜ 차이둜 μ„€λͺ…ν•  수 μžˆλŠ” 방법을 μ‘°μ‚¬ν•˜λŠ” 톡계적 μΈ‘μ •μž…λ‹ˆλ‹€. 즉, R-제곱(λ˜λŠ” R2)으둜 더 일반적으둜 μ•Œλ €μ§„ 이 κ³„μˆ˜λŠ” 두 λ³€μˆ˜ κ°„μ˜ μ„ ν˜• 관계가 μ–Όλ§ˆλ‚˜ κ°•ν•œμ§€λ₯Ό ν‰κ°€ν•˜λ©°, μΆ”μ„Έ 뢄석을 μˆ˜ν–‰ν•  λ•Œ μ—°κ΅¬μžκ°€ 크게 μ˜μ‘΄ν•©λ‹ˆλ‹€. 적용의 예λ₯Ό μΈμš©ν•˜κΈ° μœ„ν•΄ 이 κ³„μˆ˜λŠ” λ‹€μŒ μ§ˆλ¬Έμ„ κ³ λ €ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 여성이 νŠΉμ • λ‚ μ§œμ— μž„μ‹ ν•˜λ©΄ 미래의 νŠΉμ • λ‚ μ§œμ— μ•„κΈ°λ₯Ό λΆ„λ§Œν•  κ°€λŠ₯성은 μ–Όλ§ˆμž…λ‹ˆκΉŒ? 이 μ‹œλ‚˜λ¦¬μ˜€μ—μ„œ 이 μΈ‘μ •ν•­λͺ©μ€ μˆ˜νƒœμ™€ μΆœμƒμ΄λΌλŠ” 두 가지 κ΄€λ ¨ 이벀트 κ°„μ˜ 상관관계λ₯Ό κ³„μ‚°ν•˜λŠ” 것을 λͺ©ν‘œλ‘œ ν•©λ‹ˆλ‹€.

κ²°μ • κ³„μˆ˜μ˜ 이해

κ²°μ • κ³„μˆ˜λŠ” ν•œ μš”μΈμ˜ 변동성이 λ‹€λ₯Έ κ΄€λ ¨ μš”μΈκ³Όμ˜ κ΄€κ³„λ‘œ 인해 λ°œμƒν•  수 μžˆλŠ” 정도λ₯Ό μ„€λͺ…ν•˜λŠ” 데 μ‚¬μš©λ˜λŠ” μΈ‘μ •μž…λ‹ˆλ‹€. " 적합도 "둜 μ•Œλ €μ§„ 이 상관관계 λŠ” 0.0κ³Ό 1.0 μ‚¬μ΄μ˜ κ°’μœΌλ‘œ ν‘œμ‹œλ©λ‹ˆλ‹€. κ°’ 1.0은 μ™„λ²½ν•œ 적합을 λ‚˜νƒ€λ‚΄λ―€λ‘œ 미래 μ˜ˆμΈ‘μ— λŒ€ν•œ 맀우 μ‹ λ’°ν•  수 μžˆλŠ” λͺ¨λΈμ΄λ©°, κ°’ 0.0은 계산이 데이터λ₯Ό μ •ν™•ν•˜κ²Œ λͺ¨λΈλ§ν•˜μ§€ λͺ»ν–ˆμŒμ„ λ‚˜νƒ€λƒ…λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ 예λ₯Ό λ“€μ–΄ 값이 0.20이면 쒅속 λ³€μˆ˜μ˜ 20%κ°€ 독립 λ³€μˆ˜μ— μ˜ν•΄ μ˜ˆμΈ‘λœλ‹€λŠ” 것을 λ‚˜νƒ€λ‚΄λŠ” 반면 값이 0.50이면 쒅속 λ³€μˆ˜μ˜ 50%κ°€ 독립 λ³€μˆ˜μ— μ˜ν•΄ μ˜ˆμΈ‘λ˜λŠ” μ‹μž…λ‹ˆλ‹€.

κ²°μ • κ³„μˆ˜ κ·Έλž˜ν”„

κ·Έλž˜ν”„μ—μ„œ μ ν•©λ„λŠ” 적합선과 λ‹€μ΄μ–΄κ·Έλž¨ 전체에 흩어져 μžˆλŠ” λͺ¨λ“  데이터 점 μ‚¬μ΄μ˜ 거리λ₯Ό μΈ‘μ •ν•©λ‹ˆλ‹€. μ‘°λ°€ν•œ 데이터 μ§‘ν•©μ—λŠ” 점에 가깝고 적합도가 높은 νšŒκ·€μ„ μ΄ μžˆμŠ΅λ‹ˆλ‹€. 즉, μ„ κ³Ό 데이터 μ‚¬μ΄μ˜ 거리가 μ’μŠ΅λ‹ˆλ‹€. 쒋은 μ ν•©λ„λŠ” R2κ°€ 1.0에 κ°€κΉμ§€λ§Œ 이 μˆ˜μΉ˜λ§ŒμœΌλ‘œλŠ” 데이터 ν¬μΈνŠΈλ‚˜ 예츑이 편ν–₯λ˜μ—ˆλŠ”μ§€ μ—¬λΆ€λ₯Ό κ²°μ •ν•  수 μ—†μŠ΅λ‹ˆλ‹€. λ˜ν•œ κ²°μ • κ°’ κ³„μˆ˜κ°€ 본질적으둜 쒋은지 λ‚˜μœμ§€ μ—¬λΆ€λ₯Ό λΆ„μ„κ°€μ—κ²Œ μ•Œλ €μ£Όμ§€ μ•ŠμŠ΅λ‹ˆλ‹€. 이 상관 κ΄€κ³„μ˜ μ˜λ―Έμ™€ ν–₯ν›„ μΆ”μ„Έ λΆ„μ„μ˜ λ§₯λ½μ—μ„œ μ–΄λ–»κ²Œ 적용될 수 μžˆλŠ”μ§€ ν‰κ°€ν•˜λŠ” 것은 μ‚¬μš©μžμ˜ μž¬λŸ‰μž…λ‹ˆλ‹€.

ν•˜μ΄λΌμ΄νŠΈ

  • κ²°μ •κ³„μˆ˜λŠ” 데이터에 λŒ€ν•œ λͺ¨λΈμ˜ 톡계적 뢄석을 μ€‘μ‹¬μœΌλ‘œ ν•˜λŠ” λ³΅μž‘ν•œ κ°œλ…μ΄λ‹€.

  • 이 츑정값은 0.0μ—μ„œ 1.0 μ‚¬μ΄μ˜ κ°’μœΌλ‘œ ν‘œμ‹œλ˜λ©°, μ—¬κΈ°μ„œ κ°’ 1.0은 μ™„λ²½ν•œ 적합을 λ‚˜νƒ€λ‚΄λ―€λ‘œ 미래 μ˜ˆμΈ‘μ— λŒ€ν•œ 맀우 μ‹ λ’°ν•  수 μžˆλŠ” λͺ¨λΈμ΄κ³ , κ°’ 0.0은 λͺ¨λΈμ΄ 데이터λ₯Ό μ •ν™•ν•˜κ²Œ λͺ¨λΈλ§ν•˜μ§€ λͺ»ν–ˆμŒμ„ λ‚˜νƒ€λƒ…λ‹ˆλ‹€. μ‘°κΈˆλ„.

  • κ²°μ • κ³„μˆ˜λŠ” ν•œ μš”μΈμ˜ λ‹€λ₯Έ μš”μΈκ³Όμ˜ κ΄€κ³„λ‘œ 인해 λ°œμƒν•  수 μžˆλŠ” λ³€λ™μ„±μ˜ 정도λ₯Ό μ„€λͺ…ν•˜λŠ” 데 μ‚¬μš©λ©λ‹ˆλ‹€.

  • 이 κ³„μˆ˜λŠ” 일반적으둜 R-제곱(λ˜λŠ” R2)으둜 μ•Œλ €μ Έ 있으며 λ•Œλ•Œλ‘œ "적합도"라고도 ν•©λ‹ˆλ‹€.