Investor's wiki

자유도

자유도

μžμœ λ„λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

μžμœ λ„λŠ” 데이터 μƒ˜ν”Œμ—μ„œ λ³€ν•  μžμœ κ°€ μžˆλŠ” 값인 λ…Όλ¦¬μ μœΌλ‘œ 독립적인 κ°’μ˜ μ΅œλŒ€ 개수λ₯Ό λ‚˜νƒ€λƒ…λ‹ˆλ‹€.

μžμœ λ„ 이해

κ°œλ…μ μœΌλ‘œ μžμœ λ„λ₯Ό μ΄ν•΄ν•˜λŠ” κ°€μž₯ μ‰¬μš΄ 방법은 λ‹€μŒ 예λ₯Ό μ‚¬μš©ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

  • λ‹¨μˆœμ„±μ„ μœ„ν•΄ 5개의 μ–‘μ˜ μ •μˆ˜λ‘œ κ΅¬μ„±λœ 데이터 μƒ˜ν”Œμ„ κ³ λ €ν•˜μ‹­μ‹œμ˜€. 값은 μ•Œλ €μ§„ 관계가 μ—†λŠ” μž„μ˜μ˜ 숫자일 수 μžˆμŠ΅λ‹ˆλ‹€. 이 데이터 μƒ˜ν”Œμ€ 이둠적으둜 5개의 μžμœ λ„λ₯Ό κ°–μŠ΅λ‹ˆλ‹€.

  • μƒ˜ν”Œμ˜ 숫자 쀑 4κ°œλŠ” {3, 8, 5, 4}이며 전체 데이터 μƒ˜ν”Œμ˜ 평균은 6으둜 λ‚˜νƒ€λ‚©λ‹ˆλ‹€.

  • 이것은 λ‹€μ„― 번째 μˆ«μžκ°€ 10이어야 ν•œλ‹€λŠ” 것을 μ˜λ―Έν•΄μ•Ό ν•©λ‹ˆλ‹€. λ‹€λ₯Έ μ–΄λ–€ 것도 될 수 μ—†μŠ΅λ‹ˆλ‹€. λ³€ν•  μžμœ κ°€ μ—†μŠ΅λ‹ˆλ‹€.

  • λ”°λΌμ„œ 이 데이터 μƒ˜ν”Œμ˜ μžμœ λ„λŠ” 4μž…λ‹ˆλ‹€.

μžμœ λ„ 곡식은 데이터 μƒ˜ν”Œμ˜ ν¬κΈ°μ—μ„œ 1을 λΊ€ 것과 κ°™μŠ΅λ‹ˆλ‹€.

<의미둠> Df= Nβˆ’1 μ—¬κΈ°μ„œ: Df=μžμœ λ„N=μƒ˜ν”Œ 크기\begin{ μ •λ ¬} &\text\text = N - 1 \ &\textbf{μ—¬κΈ°μ„œ:} \ &\text\text = \text{도 자유} \ &N = \text{μƒ˜ν”Œ 크기} \ \end{μ •λ ¬}< /span>

μžμœ λ„λŠ” 카이제곱과 같은 ν†΅κ³„μ—μ„œ λ‹€μ–‘ν•œ ν˜•νƒœμ˜ κ°€μ„€ ν…ŒμŠ€νŠΈμ™€ κ΄€λ ¨ν•˜μ—¬ 일반적으둜 λ…Όμ˜λ©λ‹ˆλ‹€. 카이제곱 ν†΅κ³„λŸ‰μ˜ μ€‘μš”μ„±κ³Ό κ·€λ¬΄κ°€μ„€μ˜ 타당성을 μ΄ν•΄ν•˜λ €κ³  ν•  λ•Œ μžμœ λ„λ₯Ό κ³„μ‚°ν•˜λŠ” 것은 ν•„μˆ˜μ μž…λ‹ˆλ‹€.

카이제곱 κ²€μ •

카이제곱 ν…ŒμŠ€νŠΈ μ—λŠ” 두 가지 μ’…λ₯˜κ°€ μžˆμŠ΅λ‹ˆλ‹€ . 독립성 ν…ŒμŠ€νŠΈλŠ” "성별과 SAT 점수 사이에 관계가 μžˆμŠ΅λ‹ˆκΉŒ?"와 같은 관계에 λŒ€ν•œ μ§ˆλ¬Έμ„ λ˜μ§‘λ‹ˆλ‹€. "동전을 100번 λ˜μ§€λ©΄ μ•žλ©΄μ΄ 50번 λ‚˜μ˜€κ³  뒷면이 50번 λ‚˜μ˜¬κΉŒ?"와 같은 μ§ˆλ¬Έμ„ ν•˜λŠ” 적합도 ν…ŒμŠ€νŠΈ μž…λ‹ˆλ‹€.

μ΄λŸ¬ν•œ ν…ŒμŠ€νŠΈμ˜ 경우 μžμœ λ„λ₯Ό μ‚¬μš© ν•˜μ—¬ μ‹€ν—˜ λ‚΄ λ³€μˆ˜ 및 μƒ˜ν”Œμ˜ 총 수λ₯Ό 기반으둜 νŠΉμ • 귀무 κ°€μ„€ 을 기각할 수 μžˆλŠ”μ§€ μ—¬λΆ€λ₯Ό κ²°μ •ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, 학생과 μ½”μŠ€ 선택을 κ³ λ €ν•  λ•Œ 30λͺ… λ˜λŠ” 40λͺ…μ˜ 학생 ν‘œλ³Έ ν¬κΈ°λŠ” μ€‘μš”ν•œ 데이터λ₯Ό μƒμ„±ν•˜κΈ°μ— μΆ©λΆ„ν•˜μ§€ μ•Šμ„ 수 μžˆμŠ΅λ‹ˆλ‹€. 400λͺ… λ˜λŠ” 500λͺ…μ˜ ν‘œλ³Έ 크기λ₯Ό μ‚¬μš©ν•œ μ—°κ΅¬μ—μ„œ λ™μΌν•˜κ±°λ‚˜ μœ μ‚¬ν•œ κ²°κ³Όλ₯Ό μ–»λŠ” 것이 더 μœ νš¨ν•©λ‹ˆλ‹€.

μžμœ λ„μ˜ 역사

μžμœ λ„μ˜ κ°€μž₯ 초기이자 κ°€μž₯ 기본적인 κ°œλ…μ€ μˆ˜ν•™μžμ΄μž μ²œλ¬Έν•™μžμΈ Carl Friedrich Gauss의 μ—°κ΅¬μ—μ„œ μ–½νžŒ 1800λ…„λŒ€ μ΄ˆλ°˜μ— λ‚˜νƒ€λ‚¬μŠ΅λ‹ˆλ‹€. 이 μš©μ–΄μ˜ ν˜„λŒ€μ  μ‚¬μš©λ²•κ³Ό μ΄ν•΄λŠ” 영ꡭ의 ν†΅κ³„ν•™μžμΈ William Sealy Gosset이 1908λ…„ μžμ‹ μ˜ 읡λͺ…성을 μœ μ§€ν•˜κΈ° μœ„ν•΄ ν•„λͺ…μœΌλ‘œ Biometrika에 μΆœνŒν•œ "The Probable Error of a Mean"μ΄λΌλŠ” κΈ°μ‚¬μ—μ„œ 처음으둜 μ„€λͺ…λ˜μ—ˆμŠ΅λ‹ˆλ‹€.

그의 κΈ€μ—μ„œ Gosset은 "μžμœ λ„"λΌλŠ” μš©μ–΄λ₯Ό νŠΉλ³„νžˆ μ‚¬μš©ν•˜μ§€ μ•Šμ•˜μŠ΅λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ κ·ΈλŠ” κ²°κ΅­ Student's T-뢄포 둜 μ•Œλ €μ§€κ²Œ 될 것을 κ°œλ°œν•˜λŠ” κ³Όμ • μ „λ°˜μ— 걸쳐 κ°œλ…μ— λŒ€ν•œ μ„€λͺ…을 μ œκ³΅ν–ˆμŠ΅λ‹ˆλ‹€ . μ‹€μ œ μš©μ–΄λŠ” 1922λ…„κΉŒμ§€ λŒ€μ€‘ν™”λ˜μ§€ μ•Šμ•˜μŠ΅λ‹ˆλ‹€. 영ꡭ의 μƒλ¬Όν•™μžμ΄μž ν†΅κ³„ν•™μžμΈ Ronald FisherλŠ” μΉ΄μ΄μ œκ³±μ„ κ°œλ°œν•˜λŠ” μž‘μ—…μ— λŒ€ν•œ λ³΄κ³ μ„œμ™€ 데이터λ₯Ό μΆœνŒν•˜κΈ° μ‹œμž‘ν•˜λ©΄μ„œ "μžμœ λ„"λΌλŠ” μš©μ–΄λ₯Ό μ‚¬μš©ν•˜κΈ° μ‹œμž‘ν–ˆμŠ΅λ‹ˆλ‹€.

ν•˜μ΄λΌμ΄νŠΈ

  • μžμœ λ„λŠ” 카이제곱과 같은 ν†΅κ³„μ—μ„œ λ‹€μ–‘ν•œ ν˜•νƒœμ˜ κ°€μ„€ κ²€μ •κ³Ό κ΄€λ ¨ν•˜μ—¬ 일반적으둜 λ…Όμ˜λ©λ‹ˆλ‹€.

  • μžμœ λ„λŠ” 데이터 ν‘œλ³Έμ—μ„œ λ³€ν•  μžμœ κ°€ μžˆλŠ” 값인 λ…Όλ¦¬μ μœΌλ‘œ 독립적인 κ°’μ˜ μ΅œλŒ€ 개수λ₯Ό λ‚˜νƒ€λƒ…λ‹ˆλ‹€.

  • 카이제곱 ν†΅κ³„λŸ‰μ˜ μ€‘μš”μ„±κ³Ό κ·€λ¬΄κ°€μ„€μ˜ 타당성을 μ΄ν•΄ν•˜λ €λ©΄ μžμœ λ„λ₯Ό κ³„μ‚°ν•˜λŠ” 것이 μ€‘μš”ν•©λ‹ˆλ‹€.