상세 컨텐츠

본문 제목

[문헌정보통계] 4. 표집과 표집분포

수업노트

by ∫2tdt=t²+c 2016. 4. 19. 17:27

본문

표집(sampling)

표본을 뽑아내는 것. 확률에 근거해 모집단을 추리하기 위해 실시. 표집이 고르게 실시되어야 모집단을 합당하게 추론할 수 있음.

언제나 오류가 있을 가능성을 고려해야하며, 표본의 크기를 크게하고 그 신뢰수준을 제시하여 추정의 정확도를 알려줄 수 있어야함.

표본:sample, 표집:sampling


표본의 크기

전수조사가 불가능하거나, 시간과 비용을 줄이기 위해서 표본을 추출하는데, 표본의 크기(sample size)는 어느 정도이어야 할것인가?

Cochran, 1963이 표본의 크기를 구하는 공식을 제시하였음.


t: 신뢰인자(신뢰수준이 95%일때는 1.96, 99%일때는 2.58)

d: 정확도(신뢰수준이 95%일때는 0.05, 99%일때는 0.01)

p: 모집단의 특정 특성 비율. 모를 경우 0.5

q: 1-p

N: 모집단의 크기

nf: 적합한 표본의 크기


확률적 표집

  • 단수무작위 표집(simple random sampling): 모집단의 모든 요소 중 무작위로 추출. 난수표 등을 활용함
  • 계층 표집(stratified sampling): 특정 비율로 계층이 나뉘어 있는 모집단의 경우, 이 계층이 중요할 때 사용. 각 계층의 비율에 맞춰 대표성있게 뽑아내는 것. (모집단의 남녀비가 3:2일때, 500을 뽑는다면 남자 300명, 여자 200명으로 뽑는것.) 
  • 군집 표집(cluster sampling): 모집단을 몇개의 군집으로 나누고, 군집 중 몇개만 선택해 조사하는 것.
  • 다단계 표집(multistage sampling): 군집이 여러 상하위 단계로 나뉠때 각 단계별로 표집하는 것.
  • 체계적 표집(systematic sampling): 모집단에 순서를 매겨 매 n번째 표본을 추출하는것. 모집단에 특정 사이클이 있는 경우 고른 추출에 실패할 수 있음.



계층표집과 군집표집은 그룹을 나누어 뽑는다는 점에서 유사해보이지만 헷갈리면 안됨! 포도 한 송이가 모집단이라고 할때 계층표집은 전체 모든 알을 대상으로 각 알마다 조금씩 추려내서 표본을 추출하는 것이고, 군집표집은 전체 알 중 몇개를 골라 그 알들 전체를 조사하는 것.

관련글 더보기

댓글 영역