카이제곱검정
-교차분석이라고도 불림.
-두 범주형 변수에서 관찰된 빈도가 기대 빈도와 의미 있게 다른지를 검증하기 위해 사용된다. 즉, 두 범주형 변수 A, B가 종속사건인지 독립사건인지 판별하는 것
-자료가 빈도로 주어졌을 때, 특히 명목척도 자료의 분석에 이용됨
주의사항
-자유도가 1일 경우 각 관측값이 30 이상이어야 한다.
카이제곱값 계산 공식:
(예시)
1) 가설 세우기
귀무가설 H0 : 성별과 쿠폰 간 상관성이 없다.
대립가설 H1 : 성별과 쿠폰 간 상관성이 있다.
2) 관측도수
쿠폰 반응 | 쿠폰 미반응 | total | |
남성 | 200 | 300 | 500 |
여성 | 220 | 260 | 480 |
total | 420 | 560 | 980 |
3) 기대도수 구하기
쿠폰 반응 | 쿠폰 미반응 | total | |
남성 | 214.29 | 285.71 | 500 |
여성 | 205.71 | 274.29 | 480 |
total | 420 | 560 | 980 |
4) 범주별 카이제곱값 구하기
쿠폰 반응 | 쿠폰 미반응 | total | |
남성 | 0.952381 | 0.714286 | 1.666667 |
여성 | 0.992063 | 0.744048 | 1.736111 |
total | 1.944444 | 1.458333 | 3.402778 |
5) 전체 카이제곱값 구하기
= 3.402778
6) 자유도 구하기
= (2-1) * (2-1) = 1
7) 검정
유의수준 5%의 카이제곱값은 3.84
우리의 카이제곱값은 3.402778 < 3.84
따라서 귀무가설을 기각할 수 없다.
즉, 성별과 쿠폰 반응간 상관성이 없다.
참고문헌
https://hsm-edu.tistory.com/1366
https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=narasemi&logNo=221396627086
https://partrita.github.io/posts/thinkstat2/
https://hsm-edu.tistory.com/1214
https://liujingjun.tistory.com/81
https://warm-uk.tistory.com/28
http://www.statedu.com/?mid=QnA&comment_srl=78451&page=501&document_srl=78734
'Artificial Intelligence' 카테고리의 다른 글
[Pytorch] model.eval()과 with torch.no_grad()의 차이점 (0) | 2023.04.20 |
---|---|
책 "BERT와 GPT로 배우는 자연어 처리" 후기 - 한국어 언어모델 입문서적으로 최고인 책 (0) | 2022.01.10 |
척도의 종류와 의미 (0) | 2021.08.16 |
히스토그램의 정의, 장단점 (0) | 2021.08.09 |
빅데이터 시스템 조직 및 운영 체계 (1) | 2021.04.14 |