표본을 뽑아내는 것. 확률에 근거해 모집단을 추리하기 위해 실시. 표집이 고르게 실시되어야 모집단을 합당하게 추론할 수 있음.
언제나 오류가 있을 가능성을 고려해야하며, 표본의 크기를 크게하고 그 신뢰수준을 제시하여 추정의 정확도를 알려줄 수 있어야함.
표본:sample, 표집:sampling
전수조사가 불가능하거나, 시간과 비용을 줄이기 위해서 표본을 추출하는데, 표본의 크기(sample size)는 어느 정도이어야 할것인가?
Cochran, 1963이 표본의 크기를 구하는 공식을 제시하였음.
t: 신뢰인자(신뢰수준이 95%일때는 1.96, 99%일때는 2.58)
d: 정확도(신뢰수준이 95%일때는 0.05, 99%일때는 0.01)
p: 모집단의 특정 특성 비율. 모를 경우 0.5
q: 1-p
N: 모집단의 크기
nf: 적합한 표본의 크기
계층표집과 군집표집은 그룹을 나누어 뽑는다는 점에서 유사해보이지만 헷갈리면 안됨! 포도 한 송이가 모집단이라고 할때 계층표집은 전체 모든 알을 대상으로 각 알마다 조금씩 추려내서 표본을 추출하는 것이고, 군집표집은 전체 알 중 몇개를 골라 그 알들 전체를 조사하는 것.
[문헌정보통계] 5. 가설과 통계적 유의성 검증 (0) | 2016.06.09 |
---|---|
[정보표준화론] 5. DTD (0) | 2016.06.09 |
[정보표준화론] 4. Markup Language / RDF (0) | 2016.06.08 |
[텍스트정보처리론] 3. XML (0) | 2016.04.17 |
[텍스트정보처리론] 2. Tika (0) | 2016.04.17 |
[텍스트정보처리론] 1. 지프의 법칙 (0) | 2016.04.17 |
댓글 영역