상세 컨텐츠

본문 제목

[문헌정보통계] 10. 카이제곱 검정

수업노트

by ∫2tdt=t²+c 2016. 6. 11. 01:36

본문

카이제곱(χ2) 검정

실제 발생한 빈도가 예상했던 빈도와 일치하는지 여부를 확인할 때 사용.

1. 전체 범주 중 80%이상의 빈도값이 5 이상이고, 2. 측정치들이 독립적이어야 한다는 두 가지 전제가 요구됨.

쓰임

  • 여러 집단의 분산이 서로 같은지 아닌지
  • 해당 분류의 빈도가 이론적으로 예상한것에 적합한지(적합도 검정)
  • 두 변수가 독립적인지 아닌지(독립성 검정)

계산법

카이제곱값은 다음과 같이 계산할 수 있다. (여기서 F_o는 실제 관측치, F_e는 기대치)

사례들이 고루 분포한다고 가정할때 기대치는 다음과 같이 계산된다.

해당 빈도가 속한 행의 총합과 열의 총합을 곱한뒤 전체 총합으로 나누면 됨.

적합도 검정

하나의 범주형 변수의 분포가 예상한 것에 일치하는지 검정.

이때 df = K-1 (K는 전체 범주의 수)

독립성 검정(=교차분석)

둘 이상의 범주형 변수가 서로 독립인지 검정.

이때 df = (K_1 - 1) (K_2 - 1) (K_1, K_2는 각각 변수의 범주의 수)


얻어진 F값이 해당 자유도 값에서 기각역에 위치하는지 수용역에 위치하는지를 판별한다. 기각역에 속하는 경우 분포가 예상한것과 일치하지 않는다(적합도 검정), 또는 두 변수는 독립이 아니라(독립성 검정)고 결론 내릴수 있다.

효과 크기

두 변수 사시의 관계 크기를 나타냄. 효과 크기 Φ는 다음과 같이 계산된다.

범주의 수가 2x2 이상일 경우에는 크래머의 V값을 사용한다. 크래머의 V값은 범주 크기가 2x2일때 Φ와 같아진다.

효과 크기가 0이면, 기대빈도와 측정빈도가 같다, 또는 두 변수는 관련이 없다는 뜻이다.

관련글 더보기

댓글 영역