Investor's wiki

단순 무작위 샘플

단순 무작위 샘플

λ‹¨μˆœ λ¬΄μž‘μœ„ μƒ˜ν”Œμ΄λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έμ€ ν•˜μœ„ μ§‘ν•©μ˜ 각 ꡬ성원이 선택될 ν™•λ₯ μ΄ λ™μΌν•œ 톡계 λͺ¨μ§‘λ‹¨μ˜ ν•˜μœ„ μ§‘ν•©μž…λ‹ˆλ‹€. λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έμ€ 그룹의 편ν–₯λ˜μ§€ μ•Šμ€ ν‘œν˜„μ„ μ˜λ―Έν•©λ‹ˆλ‹€.

λ‹¨μˆœ 랜덀 μƒ˜ν”Œ μ΄ν•΄ν•˜κΈ°

μ—°κ΅¬μžλ“€μ€ λͺ‡ 가지 방법을 μ‚¬μš©ν•˜μ—¬ κ°„λ‹¨ν•œ λ¬΄μž‘μœ„ ν‘œλ³Έμ„ λ§Œλ“€ 수 μžˆμŠ΅λ‹ˆλ‹€. 좔첨 λ°©μ‹μ—μ„œλŠ” 인ꡬ의 각 κ΅¬μ„±μ›μ—κ²Œ λ²ˆν˜Έκ°€ ν• λ‹Ήλ˜κ³  κ·Έ ν›„ λ²ˆν˜Έκ°€ λ¬΄μž‘μœ„λ‘œ μ„ νƒλ©λ‹ˆλ‹€.

κ°„λ‹¨ν•œ λ¬΄μž‘μœ„ ν‘œλ³Έμ˜ μ˜ˆλŠ” 250λͺ…μ˜ 직원이 μžˆλŠ” νšŒμ‚¬μ˜ λͺ¨μžμ—μ„œ 25λͺ…μ˜ 직원 이름을 μ„ νƒν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. 이 경우 λͺ¨μ§‘단 은 λͺ¨λ‘ 250λͺ…μ˜ 직원이며 각 직원이 선택될 ν™•λ₯ μ΄ λ™μΌν•˜λ―€λ‘œ ν‘œλ³Έμ€ λ¬΄μž‘μœ„μž…λ‹ˆλ‹€. λ¬΄μž‘μœ„ μƒ˜ν”Œλ§μ€ κ³Όν•™μ—μ„œ λ¬΄μž‘μœ„ ν†΅μ œ ν…ŒμŠ€νŠΈλ₯Ό μˆ˜ν–‰ν•˜κ±°λ‚˜ λ§Ήκ²€ μ‹€ν—˜μ— μ‚¬μš©λ©λ‹ˆλ‹€.

직원 250λͺ… 쀑 25λͺ…μ˜ 이름을 λͺ¨μžλ‘œ 뽑은 μ‚¬λ‘€λŠ” 직μž₯μ—μ„œ 볡ꢌ λ°©μ‹μ˜ 사둀닀. 250λͺ…μ˜ μ§μ›λ“€μ—κ²ŒλŠ” 각각 1μ—μ„œ 250 μ‚¬μ΄μ˜ μˆ«μžκ°€ ν• λ‹Ήλ˜λ©°, κ·Έ ν›„ κ·Έ 숫자 쀑 25κ°œκ°€ λ¬΄μž‘μœ„λ‘œ μ„ νƒλ©λ‹ˆλ‹€.

더 큰 그룹의 ν•˜μœ„ 집합을 κ΅¬μ„±ν•˜λŠ” κ°œμΈμ€ λ¬΄μž‘μœ„λ‘œ μ„ νƒλ˜κΈ° λ•Œλ¬Έμ— 큰 인ꡬ μ§‘ν•©μ˜ 각 κ°œμΈμ€ 선택될 ν™•λ₯ μ΄ λ™μΌν•©λ‹ˆλ‹€. 이것은 λŒ€λΆ€λΆ„μ˜ 경우 편견 없이 더 큰 그룹을 λŒ€ν‘œν•  수 μžˆλŠ” κ°€μž₯ 큰 잠재λ ₯을 μ§€λ‹Œ κ· ν˜• 작힌 ν•˜μœ„ 집합을 λ§Œλ“­λ‹ˆλ‹€.

더 큰 인ꡬ의 경우 μˆ˜λ™ 좔첨 방식은 μƒλ‹Ήνžˆ 번거둜울 수 μžˆμŠ΅λ‹ˆλ‹€. λŒ€κ·œλͺ¨ λͺ¨μ§‘λ‹¨μ—μ„œ λ¬΄μž‘μœ„ ν‘œλ³Έμ„ μ„ νƒν•˜λ €λ©΄ 일반적으둜 좔첨 방식과 λ™μΌν•œ 방법둠이 μ‚¬μš©λ˜λŠ” 컴퓨터 생성 ν”„λ‘œμ„ΈμŠ€κ°€ ν•„μš”ν•˜λ©°, μ‚¬λžŒμ΄ μ•„λ‹Œ 컴퓨터가 숫자 ν• λ‹Ή 및 후속 μ„ νƒλ§Œ μˆ˜ν–‰ν•©λ‹ˆλ‹€.

였λ₯˜μ˜ 여지

μƒ˜ν”Œλ§ 였차 ) 으둜 ν‘œμ‹œλ˜λŠ” 였차의 여지가 μžˆμ–΄μ•Ό ν•©λ‹ˆλ‹€ . 예λ₯Ό λ“€μ–΄, 1,000λͺ…μ˜ 학생이 μžˆλŠ” κ³ λ“±ν•™κ΅μ—μ„œ μ–Όλ§ˆλ‚˜ λ§Žμ€ 학생이 μ™Όμ†μž‘μ΄μΈμ§€ ν™•μΈν•˜κΈ° μœ„ν•΄ 섀문쑰사λ₯Ό μˆ˜ν–‰ν•œ 경우 λ¬΄μž‘μœ„ μƒ˜ν”Œλ§μ„ 톡해 ν‘œλ³Έ μΆ”μΆœλœ 100λͺ… 쀑 8λͺ…이 μ™Όμ†μž‘μ΄μž„μ„ κ²°μ •ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 결둠은 고등학ꡐ 학생 인ꡬ의 8%κ°€ μ™Όμ†μž‘μ΄λΌλŠ” κ²ƒμ΄μ§€λ§Œ μ‹€μ œλ‘œλŠ” 세계 평균이 10%에 κ°€κΉŒμšΈ κ²ƒμž…λ‹ˆλ‹€.

μ£Όμ œμ— 관계없이 λ§ˆμ°¬κ°€μ§€μž…λ‹ˆλ‹€. 녹색 λˆˆμ„ κ°€μ‘Œκ±°λ‚˜ 신체 μž₯μ• κ°€ μžˆλŠ” 학생 인ꡬ의 λΉ„μœ¨μ— λŒ€ν•œ μ„€λ¬Έ μ‘°μ‚¬λŠ” λ‹¨μˆœ λ¬΄μž‘μœ„ μ„€λ¬Έ 쑰사λ₯Ό 기반으둜 ν•˜λŠ” μˆ˜ν•™μ  ν™•λ₯ μ„ μ΄ˆλž˜ν•˜μ§€λ§Œ 항상 ν”ŒλŸ¬μŠ€ λ˜λŠ” λ§ˆμ΄λ„ˆμŠ€ νŽΈμ°¨κ°€ μžˆμŠ΅λ‹ˆλ‹€. 100% 정확도λ₯Ό κ°–λŠ” μœ μΌν•œ 방법은 1,000λͺ…μ˜ 학생 λͺ¨λ‘μ—κ²Œ 섀문쑰사λ₯Ό ν•˜λŠ” κ²ƒμ΄μ§€λ§Œ κ°€λŠ₯ν•˜κΈ΄ ν•˜μ§€λ§Œ λΉ„ν˜„μ‹€μ μž…λ‹ˆλ‹€.

λ‹¨μˆœ λ¬΄μž‘μœ„ λŒ€ 계측화 λ¬΄μž‘μœ„ μƒ˜ν”Œ

λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έκ³Ό κ³„μΈ΅ν™”λœ λ¬΄μž‘μœ„ ν‘œλ³Έμ€ λͺ¨λ‘ 톡계적 μΈ‘μ • λ„κ΅¬μž…λ‹ˆλ‹€. λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έμ€ 전체 데이터 λͺ¨μ§‘단을 λ‚˜νƒ€λ‚΄λŠ” 데 μ‚¬μš©λ©λ‹ˆλ‹€. κ³„μΈ΅ν™”λœ λ¬΄μž‘μœ„ ν‘œλ³Έμ€ 곡유된 νŠΉμ„±μ„ 기반으둜 λͺ¨μ§‘단을 더 μž‘μ€ κ·Έλ£Ή λ˜λŠ” κ³„μΈ΅μœΌλ‘œ λ‚˜λˆ•λ‹ˆλ‹€.

λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έκ³Ό 달리 κ³„μΈ΅ν™”λœ λ¬΄μž‘μœ„ ν‘œλ³Έμ€ λ‹€λ₯Έ ν•˜μœ„ κ·Έλ£Ήμ΄λ‚˜ ν•˜μœ„ μ§‘ν•©μœΌλ‘œ μ‰½κ²Œ λ‚˜λˆŒ 수 μžˆλŠ” λͺ¨μ§‘단과 ν•¨κ»˜ μ‚¬μš©λ©λ‹ˆλ‹€. 이 그룹은 νŠΉμ • 기쀀을 기반으둜 ν•˜λ©° 각 μš”μ†ŒλŠ” 그룹의 크기 λŒ€ 인ꡬ에 λΉ„λ‘€ν•˜μ—¬ λ¬΄μž‘μœ„λ‘œ μ„ νƒλ©λ‹ˆλ‹€.

이 μƒ˜ν”Œλ§ 방법은 각각의 λ‹€λ₯Έ κ·Έλ£Ήμ—μ„œ 선택될 κ²ƒμž„μ„ μ˜λ―Έν•˜λ©°, κ·Έ ν¬κΈ°λŠ” 전체 λͺ¨μ§‘단에 λŒ€ν•œ λΉ„μœ¨μ„ 기반으둜 ν•©λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ μ—°κ΅¬μžλ“€μ€ 지측이 κ²ΉμΉ˜μ§€ μ•Šλ„λ‘ ν•΄μ•Ό ν•©λ‹ˆλ‹€. λͺ¨μ§‘λ‹¨μ˜ 각 점은 ν•˜λ‚˜μ˜ κ³„μΈ΅μ—λ§Œ 속해야 ν•˜λ―€λ‘œ 각 점은 μƒν˜Έ 배타적 μž…λ‹ˆλ‹€. 계측이 겹치면 일뢀 데이터가 포함될 κ°€λŠ₯성이 λ†’μ•„μ Έ ν‘œλ³Έμ΄ μ™œκ³‘λ©λ‹ˆλ‹€.

λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έμ˜ μž₯점과 단점

λ‹¨μˆœ λ¬΄μž‘μœ„ μƒ˜ν”Œμ€ μ‚¬μš©ν•˜κΈ° μ‰½μ§€λ§Œ 데이터λ₯Ό μ“Έλͺ¨ μ—†κ²Œ λ§Œλ“€ 수 μžˆλŠ” μ£Όμš” 단점이 μžˆμŠ΅λ‹ˆλ‹€.

μž₯점

μ‚¬μš© μš©μ΄μ„±μ€ λ‹¨μˆœ λ¬΄μž‘μœ„ μƒ˜ν”Œλ§μ˜ κ°€μž₯ 큰 μž₯μ μž…λ‹ˆλ‹€. μΈ΅ν™” λ¬΄μž‘μœ„ μƒ˜ν”Œλ§ 및 ν™•λ₯  μƒ˜ν”Œλ§κ³Ό 같은 보닀 λ³΅μž‘ν•œ μƒ˜ν”Œλ§ 방법과 달리 λͺ¨μ§‘단을 ν•˜μœ„ λͺ¨μ§‘λ‹¨μœΌλ‘œ λ‚˜λˆ„κ±°λ‚˜ λͺ¨μ§‘단 ꡬ성원을 λ¬΄μž‘μœ„λ‘œ μ„ νƒν•˜κΈ° 전에 λ‹€λ₯Έ μΆ”κ°€ 단계λ₯Ό μˆ˜ν–‰ν•  ν•„μš”κ°€ μ—†μŠ΅λ‹ˆλ‹€.

λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έμ€ 그룹의 편ν–₯λ˜μ§€ μ•Šμ€ ν‘œν˜„μ„ μ˜λ―Έν•©λ‹ˆλ‹€. λͺ¨μ§‘λ‹¨μ˜ λͺ¨λ“  ꡬ성원이 선택될 κΈ°νšŒκ°€ ν‰λ“±ν•˜κΈ° λ•Œλ¬Έμ— 더 λ§Žμ€ λͺ¨μ§‘λ‹¨μ—μ„œ ν‘œλ³Έμ„ μ„ νƒν•˜λŠ” 것이 κ³΅μ •ν•œ λ°©λ²•μœΌλ‘œ κ°„μ£Όλ©λ‹ˆλ‹€.

λ‹¨μˆœ λ¬΄μž‘μœ„ μƒ˜ν”Œλ§μ€ μΈ‘λŸ‰μ— λŒ€ν•œ 편견 μ—†λŠ” 접근을 μœ„ν•œ κ²ƒμ΄μ§€λ§Œ μƒ˜ν”Œ 선택 편ν–₯이 λ°œμƒν•  수 μžˆμŠ΅λ‹ˆλ‹€. 더 큰 λͺ¨μ§‘λ‹¨μ˜ ν‘œλ³Έ 집합이 μΆ©λΆ„νžˆ ν¬ν•¨λ˜μ§€ μ•ŠμœΌλ©΄ 전체 λͺ¨μ§‘λ‹¨μ˜ ν‘œν˜„μ΄ μ™œκ³‘λ˜μ–΄ μΆ”κ°€ ν‘œλ³Έ μΆ”μΆœ 기술이 ν•„μš”ν•©λ‹ˆλ‹€.

단점

ν‘œλ³Έμ΄ λŒ€ν‘œν•΄μ•Ό ν•˜λŠ” λͺ¨μ§‘단을 μ •ν™•ν•˜κ²Œ λ°˜μ˜ν•˜μ§€ λͺ»ν•˜λŠ” 경우 λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έμ—μ„œ ν‘œλ³Έ μΆ”μΆœ 였λ₯˜κ°€ λ°œμƒν•  수 μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, 직원 25λͺ…μ˜ λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έμ—μ„œ 인ꡬ가 125λͺ…μ˜ μ—¬μ„±, 125λͺ…μ˜ 남성 및 125λͺ…μ˜ λ…Όλ°”μ΄λ„ˆλ¦¬ μ‚¬λžŒλ“€λ‘œ κ΅¬μ„±λ˜μ–΄ μžˆμ–΄λ„ 25λͺ…μ˜ 남성을 κ·Έλ¦¬λŠ” 것이 κ°€λŠ₯ν•©λ‹ˆλ‹€.

μ΄λŸ¬ν•œ 이유둜 μ—°κ΅¬μžκ°€ λͺ¨μ§‘단에 λŒ€ν•΄ 거의 μ•Œμ§€ λͺ»ν•˜λŠ” 경우 λ‹¨μˆœ λ¬΄μž‘μœ„ μƒ˜ν”Œλ§μ΄ 더 일반적으둜 μ‚¬μš©λ©λ‹ˆλ‹€. μ—°κ΅¬μžκ°€ 더 많이 μ•Œκ³  μžˆλ‹€λ©΄ μ—°λ Ή, 인쒅 λ˜λŠ” 성별과 같은 λͺ¨μ§‘단 λ‚΄μ˜ 차이λ₯Ό μ„€λͺ…ν•˜λŠ” 데 도움이 λ˜λŠ” κ³„μΈ΅ν™”λœ λ¬΄μž‘μœ„ μƒ˜ν”Œλ§ κ³Ό 같은 λ‹€λ₯Έ μƒ˜ν”Œλ§ κΈ°μˆ μ„ μ‚¬μš©ν•˜λŠ” 것이 더 λ‚˜μ„ 것 μž…λ‹ˆλ‹€. λ‹€λ₯Έ λ‹¨μ μœΌλ‘œλŠ” λŒ€κ·œλͺ¨ λͺ¨μ§‘λ‹¨μ—μ„œ μƒ˜ν”Œλ§ν•˜λŠ” 경우 ν”„λ‘œμ„ΈμŠ€κ°€ λ‹€λ₯Έ 방법에 λΉ„ν•΄ μ‹œκ°„κ³Ό λΉ„μš©μ΄ 많이 μ†Œμš”λ  수 μžˆλ‹€λŠ” 사싀이 μžˆμŠ΅λ‹ˆλ‹€.

ν•˜μ΄λΌμ΄νŠΈ

  • ν‘œλ³Έμ΄ λŒ€ν‘œν•΄μ•Ό ν•˜λŠ” λͺ¨μ§‘단을 μ •ν™•ν•˜κ²Œ λ°˜μ˜ν•˜μ§€ λͺ»ν•˜λŠ” 경우 λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³ΈμœΌλ‘œ ν‘œλ³Έ μΆ”μΆœ 였λ₯˜κ°€ λ°œμƒν•  수 μžˆμŠ΅λ‹ˆλ‹€.

  • μ—°κ΅¬μžλŠ” μΆ”μ²¨μ΄λ‚˜ λ¬΄μž‘μœ„ 좔첨과 같은 방법을 μ‚¬μš©ν•˜μ—¬ κ°„λ‹¨ν•œ λ¬΄μž‘μœ„ ν‘œλ³Έμ„ λ§Œλ“€ 수 μžˆμŠ΅λ‹ˆλ‹€.

  • λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έμ€ 전체 데이터 μ„ΈνŠΈλ₯Ό λ‚˜νƒ€λ‚΄κΈ° μœ„ν•΄ 전체 λͺ¨μ§‘λ‹¨μ˜ μž‘μ€ λ¬΄μž‘μœ„ 뢀뢄을 μ·¨ν•˜λ©°, μ—¬κΈ°μ„œ 각 ꡬ성원은 선택될 ν™•λ₯ μ΄ λ™μΌν•©λ‹ˆλ‹€.

μžμ£Όν•˜λŠ” 질문

κ³„μΈ΅ν™”λœ λ¬΄μž‘μœ„ ν‘œλ³Έμ΄λž€ λ¬΄μ—‡μž…λ‹ˆκΉŒ?

κ³„μΈ΅ν™”λœ λ¬΄μž‘μœ„ ν‘œλ³Έμ€ λ‹¨μˆœ 좔첨과 달리 λ¨Όμ € 곡유된 νŠΉμ„±μ„ 기반으둜 λͺ¨μ§‘단을 더 μž‘μ€ κ·Έλ£Ή λ˜λŠ” κ³„μΈ΅μœΌλ‘œ λ‚˜λˆ•λ‹ˆλ‹€. λ”°λΌμ„œ κ³„μΈ΅ν™”λœ μƒ˜ν”Œλ§ μ „λž΅μ€ 각 ν•˜μœ„ 그룹의 ꡬ성원이 데이터 뢄석에 ν¬ν•¨λ˜λ„λ‘ ν•©λ‹ˆλ‹€. 계측화 μƒ˜ν”Œλ§μ€ λͺ¨μ§‘λ‹¨μ˜ λͺ¨λ“  ꡬ성원을 λ™μΌν•˜κ²Œ μ·¨κΈ‰ν•˜κ³  λ™μΌν•œ μƒ˜ν”Œλ§ κ°€λŠ₯μ„±μœΌλ‘œ μ²˜λ¦¬ν•˜λŠ” λ‹¨μˆœ λ¬΄μž‘μœ„ μƒ˜ν”Œλ§κ³Ό 달리 λͺ¨μ§‘λ‹¨μ˜ κ·Έλ£Ή κ°„μ˜ 차이λ₯Ό κ°•μ‘°ν•˜λŠ” 데 μ‚¬μš©λ©λ‹ˆλ‹€.

λ‹¨μˆœ λ¬΄μž‘μœ„ ν‘œλ³Έμ˜ 단점은 λ¬΄μ—‡μž…λ‹ˆκΉŒ?

이 κΈ°λ²•μ˜ 단점 쀑 ν•˜λ‚˜λŠ” 더 λ§Žμ€ 인ꡬ, 더 λ§Žμ€ μ‹œκ°„, 더 λ§Žμ€ λΉ„μš©, νŠΉμ • μƒν™©μ—μ„œ 편견이 μ—¬μ „νžˆ λ°œμƒν•  수 μžˆλ‹€λŠ” μ‚¬μ‹€λ‘œλΆ€ν„° λŒμ–΄λ‚Ό 수 μžˆλŠ” μ‘λ‹΅μžμ—κ²Œ μ ‘κ·Όν•˜κΈ°κ°€ μ–΄λ ΅λ‹€λŠ” κ²ƒμž…λ‹ˆλ‹€.

λ¬΄μž‘μœ„ μƒ˜ν”Œμ€ μ–΄λ–»κ²Œ μ‚¬μš©λ˜λ‚˜μš”?

λ‹¨μˆœ λ¬΄μž‘μœ„ μƒ˜ν”Œλ§μ„ μ‚¬μš©ν•˜λ©΄ μ—°κ΅¬μžκ°€ νŠΉμ • λͺ¨μ§‘단에 λŒ€ν•΄ μΌλ°˜ν™”ν•˜κ³  νŽΈκ²¬μ„ λ°°μ œν•  수 μžˆμŠ΅λ‹ˆλ‹€. 톡계 κΈ°μˆ μ„ μ‚¬μš©ν•˜λ©΄ ν•΄λ‹Ή 인ꡬ의 λͺ¨λ“  κ°œμΈμœΌλ‘œλΆ€ν„° 데이터λ₯Ό μ‘°μ‚¬ν•˜κ±°λ‚˜ μˆ˜μ§‘ν•˜μ§€ μ•Šκ³ λ„ 인ꡬ에 λŒ€ν•œ μΆ”λ‘  및 μ˜ˆμΈ‘μ„ μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

λ‹¨μˆœ λ¬΄μž‘μœ„ μƒ˜ν”Œμ΄ κ°„λ‹¨ν•œ μ΄μœ λŠ” λ¬΄μ—‡μž…λ‹ˆκΉŒ?

λ‹¨μˆœν•œ λ¬΄μž‘μœ„ μƒ˜ν”Œλ§λ³΄λ‹€ 더 큰 λͺ¨μ§‘λ‹¨μ—μ„œ 연ꡬ μƒ˜ν”Œμ„ μΆ”μΆœν•˜λŠ” 더 μ‰¬μš΄ 방법은 μ—†μŠ΅λ‹ˆλ‹€. 더 큰 λͺ¨μ§‘λ‹¨μ—μ„œ μ™„μ „νžˆ λ¬΄μž‘μœ„λ‘œ μΆ©λΆ„ν•œ λŒ€μƒμ„ μ„ νƒν•˜λ©΄ 연ꡬ λŒ€μƒ 그룹을 λŒ€ν‘œν•  수 μžˆλŠ” ν‘œλ³Έμ΄ μƒμ„±λ©λ‹ˆλ‹€.