Investor's wiki

샘플링 분포

샘플링 분포

μƒ˜ν”Œλ§ λΆ„ν¬λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

ν‘œλ³Έ λΆ„ν¬λŠ” νŠΉμ • λͺ¨μ§‘λ‹¨μ—μ„œ μΆ”μΆœν•œ 더 λ§Žμ€ ν‘œλ³Έμ—μ„œ 얻은 톡계 의 ν™•λ₯  뢄포 μž…λ‹ˆλ‹€. 주어진 λͺ¨μ§‘λ‹¨μ˜ ν‘œλ³Έ λΆ„ν¬λŠ” λͺ¨μ§‘단 톡계에 λŒ€ν•΄ λ°œμƒν•  수 μžˆλŠ” λ‹€μ–‘ν•œ κ²°κ³Ό λ²”μœ„μ˜ λΉˆλ„ λΆ„ν¬μž…λ‹ˆλ‹€ .

톡계 μ—μ„œ λͺ¨μ§‘단은 톡계 μƒ˜ν”Œ 이 μΆ”μΆœ λ˜λŠ” 전체 ν’€μž…λ‹ˆλ‹€ . λͺ¨μ§‘단은 μ‚¬λžŒ, 물건, 사건, 병원 λ°©λ¬Έ λ˜λŠ” μΈ‘μ •μ˜ 전체 그룹을 λ‚˜νƒ€λ‚Ό 수 μžˆμŠ΅λ‹ˆλ‹€. λ”°λΌμ„œ λͺ¨μ§‘단은 곡톡 νŠΉμ§•μ— μ˜ν•΄ ν•¨κ»˜ κ·Έλ£Ήν™”λœ 주제의 집계 관찰이라고 말할 수 μžˆμŠ΅λ‹ˆλ‹€.

  • ν‘œλ³Έ λΆ„ν¬λŠ” 더 λ§Žμ€ λͺ¨μ§‘λ‹¨μ—μ„œ 반볡 ν‘œλ³Έ μΆ”μΆœμ„ 톡해 얻은 ν†΅κ³„μž…λ‹ˆλ‹€.
  • μ–΄λ–€ λ³€μˆ˜μ˜ ν‰κ· μ΄λ‚˜ λͺ¨λ“œμ™€ 같은 ν†΅κ³„μ˜ κ°€λŠ₯ν•œ κ²°κ³Ό λ²”μœ„λ₯Ό μ‹€μ œλ‘œ λͺ¨μ§‘단이 μ‘΄μž¬ν•˜λ―€λ‘œ μ„€λͺ…ν•©λ‹ˆλ‹€.
  • 연ꡬ원이 λΆ„μ„ν•œ λŒ€λΆ€λΆ„μ˜ λ°μ΄ν„°λŠ” μ‹€μ œλ‘œ λͺ¨μ§‘단이 μ•„λ‹Œ ν‘œλ³Έμ—μ„œ μΆ”μΆœν•œ κ²ƒμž…λ‹ˆλ‹€.

μƒ˜ν”Œλ§ 뢄포 μ΄ν•΄ν•˜κΈ°

ν•™μž, ν†΅κ³„ν•™μž, 연ꡬ원, λ§ˆμΌ€ν„°, 뢄석가 등이 뽑고 μ‚¬μš©ν•˜λŠ” λ§Žμ€ λ°μ΄ν„°λŠ” μ‹€μ œλ‘œ λͺ¨μ§‘단이 μ•„λ‹ˆλΌ ν‘œλ³Έμž…λ‹ˆλ‹€. ν‘œλ³Έμ€ λͺ¨μ§‘λ‹¨μ˜ ν•˜μœ„ μ§‘ν•©μž…λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, 1995λ…„λΆ€ν„° 2005λ…„κΉŒμ§€ λΆλ―Έμ—μ„œ νƒœμ–΄λ‚œ λͺ¨λ“  μ•„κΈ°μ˜ 평균 체쀑과 같은 기간에 λ‚¨λ―Έμ—μ„œ νƒœμ–΄λ‚œ μ•„κΈ°μ˜ 평균 체쀑을 λΉ„κ΅ν•˜λ €λŠ” 의료 연ꡬ원은 합리적인 μ‹œκ°„ 내에 전체 인ꡬ에 λŒ€ν•œ 데이터λ₯Ό 그릴 수 μ—†μŠ΅λ‹ˆλ‹€. 10λ…„ λ™μ•ˆ 백만 λͺ…이 λ„˜λŠ” μΆœμ‚°μ΄ λ°œμƒν–ˆμŠ΅λ‹ˆλ‹€. λŒ€μ‹  그듀은 결둠을 내리기 μœ„ν•΄ 각 λŒ€λ₯™μ—μ„œ 예λ₯Ό λ“€μ–΄ 100λͺ…μ˜ μ•„κΈ°μ˜ μ²΄μ€‘λ§Œμ„ μ‚¬μš©ν•  κ²ƒμž…λ‹ˆλ‹€. μ‚¬μš©λœ 200λͺ…μ˜ μ•„κΈ°μ˜ 체쀑이 ν‘œλ³Έμ΄κ³  κ³„μ‚°λœ 평균 체쀑이 ν‘œλ³Έ ν‰κ· μž…λ‹ˆλ‹€.

이제 의료 연ꡬ원이 각 λŒ€λ₯™μ—μ„œ 100개의 신생아 체쀑 쀑 ν•˜λ‚˜μ˜ μƒ˜ν”Œλ§Œ μ·¨ν•˜λŠ” λŒ€μ‹  일반 μΈκ΅¬μ—μ„œ λ°˜λ³΅λ˜λŠ” λ¬΄μž‘μœ„ μƒ˜ν”Œμ„ μ·¨ν•˜μ—¬ 각 μƒ˜ν”Œ 그룹에 λŒ€ν•œ μƒ˜ν”Œ 평균을 κ³„μ‚°ν•œλ‹€κ³  κ°€μ •ν•©λ‹ˆλ‹€. λ”°λΌμ„œ 뢁미의 경우 λ―Έκ΅­, μΊλ‚˜λ‹€ 및 λ©•μ‹œμ½”μ—μ„œ 기둝된 100λͺ…μ˜ 신생아 체쀑에 λŒ€ν•œ 데이터λ₯Ό λ‹€μŒκ³Ό 같이 κ°€μ Έμ˜΅λ‹ˆλ‹€. 12μ„ΈνŠΈλ‘œ λΆ„λ₯˜λœ 1,200개의 신생아 체쀑 쀑 그듀은 λ˜ν•œ λ‚¨λ―Έμ˜ 12κ°œκ΅­μ—μ„œ 100λͺ…μ˜ μΆœμƒ 체쀑에 λŒ€ν•œ μƒ˜ν”Œ 데이터λ₯Ό μˆ˜μ§‘ν•©λ‹ˆλ‹€.

각 ν‘œλ³Έμ—λŠ” κ³ μœ ν•œ ν‘œλ³Έ 평균이 있으며 ν‘œλ³Έ ν‰κ· μ˜ 뢄포λ₯Ό ν‘œλ³Έ 뢄포라고 ν•©λ‹ˆλ‹€.

각 μƒ˜ν”Œ μ„ΈνŠΈμ— λŒ€ν•΄ κ³„μ‚°λœ 평균 κ°€μ€‘μΉ˜λŠ” ν‰κ· μ˜ μƒ˜ν”Œλ§ λΆ„ν¬μž…λ‹ˆλ‹€. ν‘œλ³Έμ—μ„œ ν‰κ· λ§Œ 계산할 수 μžˆλŠ” 것은 μ•„λ‹™λ‹ˆλ‹€. ν‘œμ€€ 편차, λΆ„μ‚°, λΉ„μœ¨ 및 λ²”μœ„μ™€ 같은 기타 톡계 λŠ” μƒ˜ν”Œ λ°μ΄ν„°μ—μ„œ 계산할 수 μžˆμŠ΅λ‹ˆλ‹€. ν‘œμ€€ νŽΈμ°¨μ™€ 뢄산은 μƒ˜ν”Œλ§ λΆ„ν¬μ˜ 변동성을 μΈ‘μ •ν•©λ‹ˆλ‹€.

λͺ¨μ§‘λ‹¨μ˜ κ΄€μΈ‘μΉ˜ 수, ν‘œλ³Έμ˜ κ΄€μΈ‘μΉ˜ 수 및 ν‘œλ³Έ 집합을 μΆ”μΆœν•˜λŠ” 데 μ‚¬μš©λœ μ ˆμ°¨μ— 따라 ν‘œλ³Έ λΆ„ν¬μ˜ 변동성이 κ²°μ •λ©λ‹ˆλ‹€. ν‘œλ³Έ λΆ„ν¬μ˜ ν‘œμ€€ 편차λ₯Ό ν‘œμ€€ 였차 라고 ν•©λ‹ˆλ‹€. ν‘œλ³Έ λΆ„ν¬μ˜ 평균은 λͺ¨μ§‘λ‹¨μ˜ 평균과 κ°™μ§€λ§Œ ν‘œμ€€ μ˜€μ°¨λŠ” λͺ¨μ§‘λ‹¨μ˜ ν‘œμ€€ 편차, λͺ¨μ§‘단 크기 및 ν‘œλ³Έ 크기에 따라 λ‹€λ¦…λ‹ˆλ‹€.

각 ν‘œλ³Έ μ§‘ν•©μ˜ 평균이 μ„œλ‘œ 그리고 λͺ¨μ§‘단 ν‰κ· μ—μ„œ μ–Όλ§ˆλ‚˜ λ–¨μ–΄μ Έ μžˆλŠ”μ§€ μ•Œλ©΄ ν‘œλ³Έ 평균이 λͺ¨μ§‘단 평균에 μ–Όλ§ˆλ‚˜ κ°€κΉŒμš΄μ§€λ₯Ό μ•Œ 수 μžˆμŠ΅λ‹ˆλ‹€. ν‘œλ³Έ 크기가 컀질수둝 ν‘œλ³Έ λΆ„ν¬μ˜ ν‘œμ€€ μ˜€μ°¨λŠ” κ°μ†Œν•©λ‹ˆλ‹€.

νŠΉλ³„ κ³ λ € 사항

λͺ¨μ§‘단 λ˜λŠ” 숫자의 ν•˜λ‚˜μ˜ ν‘œλ³Έ 집합은 μ •κ·œ 뢄포λ₯Ό κ°–μŠ΅λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ μƒ˜ν”Œλ§ λΆ„ν¬μ—λŠ” μ—¬λŸ¬ κ΄€μΈ‘κ°’ 집합이 ν¬ν•¨λ˜κΈ° λ•Œλ¬Έμ— λ°˜λ“œμ‹œ 쒅곑선 λͺ¨μ–‘을 κ°€μ§ˆ ν•„μš”λŠ” μ—†μŠ΅λ‹ˆλ‹€.

우리의 μ˜ˆμ— λ”°λ₯΄λ©΄ 뢁미와 λ‚¨λ―Έμ—μ„œ μ•„κΈ°μ˜ 인ꡬ 평균 체쀑은 μ •κ·œ 뢄포λ₯Ό λ‚˜νƒ€λƒ…λ‹ˆλ‹€. μ™œλƒν•˜λ©΄ 일뢀 μ•„κΈ°λŠ” 저체쀑(평균 미만) λ˜λŠ” 과체쀑(평균 이상)이고 λŒ€λΆ€λΆ„μ˜ μ•„κΈ°λŠ” κ·Έ 사이(평균 λΆ€κ·Ό)에 있기 λ•Œλ¬Έμž…λ‹ˆλ‹€. ). λΆλ―Έμ—μ„œ μ‹ μƒμ•„μ˜ 평균 체쀑이 7νŒŒμš΄λ“œμΈ 경우 뢁미에 λŒ€ν•΄ 기둝된 12개의 μƒ˜ν”Œ κ΄€μ°° μ„ΈνŠΈ 각각의 μƒ˜ν”Œ 평균 체쀑도 7νŒŒμš΄λ“œμ— κ°€κΉŒμšΈ κ²ƒμž…λ‹ˆλ‹€.

κ·ΈλŸ¬λ‚˜ 1,200개의 μƒ˜ν”Œ κ·Έλ£Ή κ°κ°μ—μ„œ κ³„μ‚°λœ 각각의 평균을 κ·Έλž˜ν”„λ‘œ λ‚˜νƒ€λ‚΄λ©΄ κ²°κ³Ό λͺ¨μ–‘이 κ· μΌν•œ 뢄포가 될 수 μžˆμ§€λ§Œ μ‹€μ œ λͺ¨μ–‘이 λ¬΄μ—‡μœΌλ‘œ λ‚˜νƒ€λ‚ μ§€ ν™•μ‹€ν•˜κ²Œ μ˜ˆμΈ‘ν•˜κΈ° μ–΄λ ΅μŠ΅λ‹ˆλ‹€. 연ꡬ원이 백만 κ°œκ°€ λ„˜λŠ” μΈκ΅¬μ—μ„œ 더 λ§Žμ€ μƒ˜ν”Œμ„ μ‚¬μš©ν• μˆ˜λ‘ κ·Έλž˜ν”„λŠ” 더 λ§Žμ€ μ •κ·œ 뢄포λ₯Ό ν˜•μ„±ν•˜κΈ° μ‹œμž‘ν•©λ‹ˆλ‹€.