실제 발생한 빈도가 예상했던 빈도와 일치하는지 여부를 확인할 때 사용.
1. 전체 범주 중 80%이상의 빈도값이 5 이상이고, 2. 측정치들이 독립적이어야 한다는 두 가지 전제가 요구됨.
카이제곱값은 다음과 같이 계산할 수 있다. (여기서 F_o는 실제 관측치, F_e는 기대치)
사례들이 고루 분포한다고 가정할때 기대치는 다음과 같이 계산된다.
해당 빈도가 속한 행의 총합과 열의 총합을 곱한뒤 전체 총합으로 나누면 됨.
하나의 범주형 변수의 분포가 예상한 것에 일치하는지 검정.
이때 df = K-1 (K는 전체 범주의 수)
둘 이상의 범주형 변수가 서로 독립인지 검정.
이때 df = (K_1 - 1) (K_2 - 1) (K_1, K_2는 각각 변수의 범주의 수)
얻어진 F값이 해당 자유도 값에서 기각역에 위치하는지 수용역에 위치하는지를 판별한다. 기각역에 속하는 경우 분포가 예상한것과 일치하지 않는다(적합도 검정), 또는 두 변수는 독립이 아니라(독립성 검정)고 결론 내릴수 있다.
두 변수 사시의 관계 크기를 나타냄. 효과 크기 Φ는 다음과 같이 계산된다.
범주의 수가 2x2 이상일 경우에는 크래머의 V값을 사용한다. 크래머의 V값은 범주 크기가 2x2일때 Φ와 같아진다.
효과 크기가 0이면, 기대빈도와 측정빈도가 같다, 또는 두 변수는 관련이 없다는 뜻이다.
SentiWordNet과 감성분석 (10) | 2017.05.25 |
---|---|
[고고학연구법] 고고학사, 발굴, 연대측정 (0) | 2016.10.20 |
[문헌정보학입문] 시각화자료 (0) | 2016.06.11 |
[문헌정보통계] 9. 회귀분석 (0) | 2016.06.11 |
[문헌정보통계] 8. t검정과 ANOVA, 사후검정 (1) | 2016.06.10 |
자료분류표의 유형별 구분 (0) | 2016.06.10 |
댓글 영역