Investor's wiki

카이제곱(χ2) 통계

카이제곱(χ2) 통계

카이제곱 ν†΅κ³„λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

카이제곱(Ο‡2) ^ν†΅κ³„λŸ‰μ€ λͺ¨λΈμ„ μ‹€μ œ κ΄€μ°°λœ 데이터와 λΉ„κ΅ν•˜λŠ” 방법을 μΈ‘μ •ν•˜λŠ” ν…ŒμŠ€νŠΈμž…λ‹ˆλ‹€. 카이제곱 ν†΅κ³„λŸ‰ 계산에 μ‚¬μš©λ˜λŠ” 데이터 λŠ” λ¬΄μž‘μœ„, μ›μ‹œ, μƒν˜Έ 배타적,. 독립 λ³€μˆ˜ 및 μΆ©λΆ„νžˆ 큰 ν‘œλ³Έμ—μ„œ μΆ”μΆœν•œ 데이터여야 ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, κ³΅μ •ν•œ 동전을 λ˜μ§„ κ²°κ³ΌλŠ” μ΄λŸ¬ν•œ 기쀀을 μΆ©μ‘±ν•©λ‹ˆλ‹€.

카이제곱 검정은 μ’…μ’… κ°€μ„€ κ²€μ • 에 μ‚¬μš©λ©λ‹ˆλ‹€. 카이-제곱 ν†΅κ³„λŸ‰μ€ ν‘œλ³Έ 크기와 κ΄€κ³„μ˜ λ³€μˆ˜ 수λ₯Ό κ³ λ €ν•˜μ—¬ μ˜ˆμƒ 결과와 μ‹€μ œ κ²°κ³Ό κ°„μ˜ 뢈일치 크기λ₯Ό λΉ„κ΅ν•©λ‹ˆλ‹€.

μ΄λŸ¬ν•œ ν…ŒμŠ€νŠΈ 의 경우 μžμœ λ„ λ₯Ό μ‚¬μš© ν•˜μ—¬ μ‹€ν—˜ λ‚΄ λ³€μˆ˜ 및 μƒ˜ν”Œμ˜ 총 수λ₯Ό 기반으둜 νŠΉμ • 귀무 κ°€μ„€ 을 기각할 수 μžˆλŠ”μ§€ μ—¬λΆ€λ₯Ό κ²°μ •ν•©λ‹ˆλ‹€. λ‹€λ₯Έ 톡계와 λ§ˆμ°¬κ°€μ§€λ‘œ ν‘œλ³Έ 크기가 클수둝 결과의 신뒰도가 λ†’μ•„μ§‘λ‹ˆλ‹€.

카이제곱 곡식은

<의미둠> Ο‡c2 =βˆ‘(O iβˆ’Ei)2Ei</ mfrac></ mtd>μ—¬κΈ°μ„œ: <mstyle scriptlevel=" 0" λ””μŠ€ν”Œλ ˆμ΄ μŠ€νƒ€μΌ="t rue">c=μžμœ λ„<mstyle scriptlevel="0" λ””μŠ€ν”Œλ ˆμ΄ μŠ€νƒ€μΌ ="true">O=κ΄€μ°°κ°’E=μ˜ˆμƒ κ°’\begin&\chi^2_c = \sum \frac{(O_i - E_i )^2} \&\textbf{μ—¬κΈ°μ„œ:}\&c=\text{μžμœ λ„}\&O=\text{κ΄€μΈ‘κ°’}\&E =\text{μ˜ˆμƒ κ°’}\end{μ •λ ¬}<span class="pstrut" μŠ€νƒ€μΌ="높이:3.491108em; ">Ο‡<span class="vlist" μŠ€νƒ€μΌ="높이:0.8641079999999999em;"><슀팬 μŠ€νƒ€μΌ= "상단:-2.4530000000000003em;margin-left:0em;margin-right:0.05em;">c< 슀팬 클래슀="pstrut" μŠ€νƒ€μΌ="높이:2.7em;">2​=βˆ‘<span class="vlist" μŠ€νƒ€μΌ="높이:1.491108em;"><span μŠ€νƒ€μΌ="top:-2.3139999999999996em;"><span class="pstrut" μŠ€νƒ€μΌ="높이:3em;">< /span>Eλ‚˜λŠ”β€‹</ 슀팬><span class="frac-line" μŠ€νƒ€μΌ= "ν…Œλ‘λ¦¬ λ°”λ‹₯ λ„ˆλΉ„:0.04em;">< /span>(O<span class="vlist" μŠ€νƒ€μΌ="높이: 0.3116639999999994em;"> i​< span class="vlist-r">< /span>βˆ’Ei​)2​</ 슀팬></ span>μ—¬κΈ°μ„œ :c</s 팬>=<슀팬 클래슀 ="mord">μžμœ λ„O< /span>=κ΄€μ°°λœ κ°’ E</ span>=μ˜ˆμƒ 값​

카이제곱 ν†΅κ³„λŠ” 무엇을 λ§ν•©λ‹ˆκΉŒ?

카이 제곱 ν…ŒμŠ€νŠΈμ—λŠ” 두 가지 μ£Όμš” μ’…λ₯˜κ°€ μžˆμŠ΅λ‹ˆλ‹€. 독립성 ν…ŒμŠ€νŠΈλŠ” "학생 성별과 μ½”μŠ€ 선택 사이에 관계가 μžˆμŠ΅λ‹ˆκΉŒ?"와 같은 관계에 λŒ€ν•œ μ§ˆλ¬Έμ„ λ˜μ§‘λ‹ˆλ‹€. "λ‚΄ 손에 μžˆλŠ” 동전이 이둠적으둜 κ³΅μ •ν•œ 동전과 μ–Όλ§ˆλ‚˜ 잘 μΌμΉ˜ν•©λ‹ˆκΉŒ?"와 같은 μ§ˆλ¬Έμ„ ν•˜λŠ” 적합도 ν…ŒμŠ€νŠΈμž…λ‹ˆλ‹€ .

카이제곱 뢄석은 λ²”μ£Όν˜• λ³€μˆ˜μ— 적용되며 μ΄λŸ¬ν•œ λ³€μˆ˜κ°€ λͺ…λͺ©μΌ λ•Œ 특히 μœ μš©ν•©λ‹ˆλ‹€(결혼 μ—¬λΆ€λ‚˜ 성별과 같이 μˆœμ„œκ°€ μ€‘μš”ν•˜μ§€ μ•Šμ€ 경우).

독립

ν•™μƒμ˜ 성별과 μ½”μŠ€ 선택을 κ³ λ €ν•  λ•Œ Ο‡2 독립성 검정을 μ‚¬μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 이 ν…ŒμŠ€νŠΈλ₯Ό μˆ˜ν–‰ν•˜κΈ° μœ„ν•΄ 연ꡬ원은 μ„ νƒν•œ 두 λ³€μˆ˜(성별 및 μ„ νƒν•œ κ³Όλͺ©)에 λŒ€ν•œ 데이터λ₯Ό μˆ˜μ§‘ν•œ λ‹€μŒ μœ„μ— 주어진 곡식과 Ο‡λ₯Ό μ‚¬μš©ν•˜μ—¬ 제곡된 μˆ˜μ—… μ€‘μ—μ„œ 남학생과 여학생이 μ„ νƒν•˜λŠ” λΉˆλ„λ₯Ό λΉ„κ΅ν•©λ‹ˆλ‹€. 2 ν†΅κ³„ν‘œ.

성별과 κ³Όμ • 선택 사이에 관계가 μ—†λŠ” 경우(즉, 독립적인 경우), 남학생과 여학생이 μ œκ³΅λ˜λŠ” 각 과정을 μ„ νƒν•˜λŠ” μ‹€μ œ λΉˆλ„λŠ” 거의 κ°™κ±°λ‚˜ λ°˜λŒ€λ‘œ 남학생과 μ—¬ν•™μƒμ˜ λΉ„μœ¨μ΄ 거의 같을 κ²ƒμœΌλ‘œ μ˜ˆμƒλ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€. μ„ νƒν•œ κ³Όμ •μ˜ 여학생 μˆ˜λŠ” ν‘œλ³Έμ˜ 남학생 및 여학생 λΉ„μœ¨κ³Ό 거의 κ°™μ•„μ•Ό ν•©λ‹ˆλ‹€.

독립성에 λŒ€ν•œ Ο‡2 ν…ŒμŠ€νŠΈλŠ” λ¬΄μž‘μœ„ ν™•λ₯ μ΄ λ°μ΄ν„°μ˜ μ‹€μ œ λΉˆλ„μ™€ μ΄λŸ¬ν•œ 이둠적 κΈ°λŒ€ μ‚¬μ΄μ˜ κ΄€μ°°λœ 차이λ₯Ό μ„€λͺ…ν•  수 μžˆλŠ” κ°€λŠ₯성을 μ•Œλ €μ€λ‹ˆλ‹€.

적합도

Ο‡2λŠ” 데이터 ν‘œλ³Έμ΄ ν‘œλ³Έμ΄ λ‚˜νƒ€λ‚΄λ €λŠ” 더 큰 λͺ¨μ§‘λ‹¨μ˜ (μ•Œλ €μ§„ λ˜λŠ” κ°€μ •λœ) νŠΉμ„±κ³Ό μ–Όλ§ˆλ‚˜ 잘 μΌμΉ˜ν•˜λŠ”μ§€ ν…ŒμŠ€νŠΈν•˜λŠ” 방법을 μ œκ³΅ν•©λ‹ˆλ‹€. 이것을 적합도라고 ν•©λ‹ˆλ‹€. ν‘œλ³Έ 데이터가 관심 μžˆλŠ” λͺ¨μ§‘λ‹¨μ˜ μ˜ˆμƒ 속성에 λ§žμ§€ μ•ŠμœΌλ©΄ 이 ν‘œλ³Έμ„ μ‚¬μš©ν•˜μ—¬ 더 큰 λͺ¨μ§‘단에 λŒ€ν•œ 결둠을 λ„μΆœν•˜κ³  싢지 μ•Šμ„ κ²ƒμž…λ‹ˆλ‹€.

μ˜ˆμ‹œ

예λ₯Ό λ“€μ–΄ μ•žλ©΄μ΄λ‚˜ 뒷면이 λ‚˜μ˜¬ ν™•λ₯ μ΄ μ •ν™•νžˆ 50/50인 κ°€μƒμ˜ 동전과 100번 λ˜μ§„ μ‹€μ œ 동전을 생각해 λ³΄μ‹­μ‹œμ˜€. 이 동전이 κ³΅ν‰ν•˜λ‹€λ©΄ μ–‘μͺ½ λͺ¨λ‘ 같은 ν™•λ₯ λ‘œ λ‚˜μ˜¬ 것이고 동전을 100번 던질 λ•Œ μ˜ˆμƒλ˜λŠ” κ²°κ³ΌλŠ” μ•žλ©΄μ΄ 50번 λ‚˜μ˜€κ³  뒷면이 50번 λ‚˜μ˜¬ κ²ƒμž…λ‹ˆλ‹€.

이 경우 Ο‡2λŠ” 100회 동전 λ˜μ§€κΈ°μ˜ μ‹€μ œ κ²°κ³Όκ°€ κ³΅μ •ν•œ 동전이 50/50 κ²°κ³Όλ₯Ό 쀄 κ²ƒμ΄λΌλŠ” 이둠적인 λͺ¨λΈκ³Ό μ–Όλ§ˆλ‚˜ 잘 λΉ„κ΅λ˜λŠ”μ§€ μ•Œλ €μ€„ 수 μžˆμŠ΅λ‹ˆλ‹€. μ‹€μ œ ν† μŠ€λŠ” 50/50, 60/40, λ˜λŠ” 90/10이 될 수 μžˆμŠ΅λ‹ˆλ‹€. 100회 λ˜μ§€κΈ°μ˜ μ‹€μ œ κ²°κ³Όκ°€ 50/50μ—μ„œ λ©€μ–΄μ§ˆμˆ˜λ‘ 이 λ˜μ§€κΈ° μ„ΈνŠΈμ˜ 적합성이 이둠적 κΈ°λŒ€μΉ˜μΈ 50/50에 덜 μ ν•©ν•˜κ³  이 동전이 μ‹€μ œλ‘œλŠ” 그렇지 μ•Šλ‹€κ³  결둠을 내릴 κ°€λŠ₯성이 더 λ†’μŠ΅λ‹ˆλ‹€. κ³΅μ •ν•œ 동전.

카이제곱 검정을 μ‚¬μš©ν•˜λŠ” 경우

카이제곱 검정은 κ΄€μ°°λœ κ²°κ³Όκ°€ μ˜ˆμƒ 결과와 μΌμΉ˜ν•˜λŠ”μ§€ ν™•μΈν•˜κ³  관찰이 μš°μ—°μ— μ˜ν•œ κ²ƒμž„μ„ λ°°μ œν•˜λŠ” 데 μ‚¬μš©λ©λ‹ˆλ‹€. 카이제곱 검정은 뢄석 쀑인 데이터가 λ¬΄μž‘μœ„ ν‘œλ³Έ μ—μ„œ μΆ”μΆœλ˜κ³  ν•΄λ‹Ή λ³€μˆ˜κ°€ λ²”μ£Όν˜• λ³€μˆ˜μΈ κ²½μš°μ— μ ν•©ν•©λ‹ˆλ‹€. λ²”μ£Όν˜• λ³€μˆ˜λŠ” μžλ™μ°¨ μœ ν˜•, 인쒅, ν•™λ ₯, 남성 λŒ€ μ—¬μ„±, λˆ„κ΅°κ°€κ°€ μ •μΉ˜ ν›„λ³΄μžλ₯Ό μ–Όλ§ˆλ‚˜ μ’‹μ•„ν•˜λŠ”μ§€(맀우 λ§Žμ΄μ—μ„œ 맀우 적게) λ“±κ³Ό 같은 μ„ νƒμœΌλ‘œ κ΅¬μ„±λœ λ³€μˆ˜μž…λ‹ˆλ‹€.

μ΄λŸ¬ν•œ μœ ν˜•μ˜ λ°μ΄ν„°λŠ” μ’…μ’… 섀문쑰사 μ‘λ‹΅μ΄λ‚˜ 섀문지λ₯Ό 톡해 μˆ˜μ§‘λ©λ‹ˆλ‹€. λ”°λΌμ„œ 카이제곱 뢄석은 μ’…μ’… μ΄λŸ¬ν•œ μœ ν˜•μ˜ 데이터λ₯Ό λΆ„μ„ν•˜λŠ” 데 κ°€μž₯ μœ μš©ν•©λ‹ˆλ‹€.

ν•˜μ΄λΌμ΄νŠΈ

  • Ο‡2λŠ” μ‹€μ œκ°’κ³Ό κ΄€μΈ‘κ°’μ˜ 차이 크기, μžμœ λ„, ν‘œλ³Έ 크기에 따라 λ‹¬λΌμ§‘λ‹ˆλ‹€.

  • 카이제곱(Ο‡2) ^ν†΅κ³„λŸ‰μ€ 일련의 이벀트 λ˜λŠ” λ³€μˆ˜ 결과의 κ΄€μ°°λœ λΉˆλ„μ™€ μ˜ˆμƒ λΉˆλ„ κ°„μ˜ 차이λ₯Ό μΈ‘μ •ν•œ κ²ƒμž…λ‹ˆλ‹€.

  • μΉ΄μ΄μ œκ³±μ€ λ²”μ£Όν˜• λ³€μˆ˜, 특히 본질적으둜 λͺ…λͺ©ν˜• λ³€μˆ˜μ˜ μ΄λŸ¬ν•œ 차이λ₯Ό λΆ„μ„ν•˜λŠ” 데 μœ μš©ν•©λ‹ˆλ‹€.

  • κ΄€μΈ‘λœ 뢄포와 이둠적인 λΉˆλ„ 뢄포 μ‚¬μ΄μ˜ 적합도λ₯Ό ν…ŒμŠ€νŠΈν•˜λŠ” 데에도 μ‚¬μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

  • Ο‡2λŠ” 두 λ³€μˆ˜κ°€ μ„œλ‘œ 관련이 μžˆλŠ”μ§€ λ˜λŠ” 독립적인지 ν…ŒμŠ€νŠΈν•˜λŠ” 데 μ‚¬μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

μžμ£Όν•˜λŠ” 질문

독립 λ³€μˆ˜κ°€ λͺ…λͺ© λ˜λŠ” μˆœμ„œμΌ λ•Œ 카이제곱 뢄석이 μ‚¬μš©λ©λ‹ˆκΉŒ?

λͺ…λͺ© λ³€μˆ˜λŠ” ν’ˆμ§ˆμ— 따라 λ‹€λ₯΄μ§€λ§Œ 숫자 μˆœμ„œκ°€ 관련이 없을 수 μžˆλŠ” λ²”μ£Όν˜• λ³€μˆ˜μž…λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, λˆ„κ΅°κ°€μ—κ²Œ κ°€μž₯ μ’‹μ•„ν•˜λŠ” 색상을 λ¬»λŠ” 것은 λͺ…λͺ© λ³€μˆ˜λ₯Ό μƒμ„±ν•©λ‹ˆλ‹€. λ°˜λ©΄μ— λˆ„κ΅°κ°€μ˜ λ‚˜μ΄λ₯Ό λ¬»λŠ” 것은 μ„œμˆ˜ 데이터 μ„ΈνŠΈλ₯Ό μƒμ„±ν•©λ‹ˆλ‹€. μΉ΄μ΄μ œκ³±μ€ λͺ…λͺ© 데이터에 κ°€μž₯ 잘 적용될 수 μžˆμŠ΅λ‹ˆλ‹€.

λˆ„κ°€ 카이제곱 뢄석을 μ‚¬μš©ν•©λ‹ˆκΉŒ?

μΉ΄μ΄μ œκ³±μ€ λ²”μ£Όν˜• λ³€μˆ˜μ— 적용되기 λ•Œλ¬Έμ— μ„€λ¬Έ 응닡 데이터λ₯Ό μ—°κ΅¬ν•˜λŠ” μ—°κ΅¬μžλ“€μ΄ κ°€μž₯ 많이 μ‚¬μš©ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ μœ ν˜•μ˜ μ—°κ΅¬λŠ” 인ꡬ ν†΅κ³„μ—μ„œ μ†ŒλΉ„μž 및 λ§ˆμΌ€νŒ… 연ꡬ, μ •μΉ˜ κ³Όν•™ 및 κ²½μ œν•™μ— 이λ₯΄κΈ°κΉŒμ§€ λ‹€μ–‘ν•©λ‹ˆλ‹€.

카이제곱 검정은 μ–΄λ–€ μš©λ„λ‘œ μ‚¬μš©λ˜λ‚˜μš”?

μΉ΄μ΄μ œκ³±μ€ μ˜ˆμƒ 결과와 κ΄€μ°°λœ κ²°κ³Ό κ°„μ˜ 적합도λ₯Ό νŒλ‹¨ν•˜κΈ° μœ„ν•΄ λ¬΄μž‘μœ„ ν‘œλ³Έμ˜ λ²”μ£Όν˜• λ³€μˆ˜ κ°„μ˜ 차이λ₯Ό μ‘°μ‚¬ν•˜λŠ” 데 μ‚¬μš©λ˜λŠ” 톡계적 κ²€μ •μž…λ‹ˆλ‹€.