제삼취미/통계

추론 통계에 대한 기본 이해(증명 아닌 유의성 검정)

카리스χάρης 2022. 11. 23. 18:16


모집단에 대해 가설을 세우지만
표본의 자료를 수집하는게 현실이고,
이 표본을 분석하여 (가설을 세우는 방식으로)
모집단에 대한 이론을
추론
하게 된다..

우리는 불완전한 측정과 표본을 사용하기 때문에 완벽한 증명을 보일 수는 없다. 확률을 사용할 수 있을 뿐이다.
그래서 추론통계라고 부른다.

 


가설을 세우고 가설의 타당성을 보이는게 목적이고,

두가지 가설을 세우는데, 귀무가설과 대립가설이 그것이다.

대립가설은 나의 연구 목적이자 내가 세우고자 하는 가설이고, 귀무가설은 기각 당하는 것을 목적으로 하는 가설이다. 

 

이때, 사용되는 증명(추론)전략은

반증을 통한 전략이고,  

이것이 귀무가설의 존재 이유이다.

귀무가설은...
반증, 즉 기각 당하는 것을 목적으로 하는 가설이다.

반증? 이라고 언급은 했지만

완벽한 반증이라고 말할 수도 없다. 

확률적으로 어찌어찌하다 라는 식으로 반증하기 때문이다. 

그래도, 통계를 사용하는 세상에서는 어느정도의 신뢰도로 가설을 받아들이겠다는 동의를 기반으로 하기 때문에

이런식으로 반증해도 괜찮다.



추론통계에서는 확률이 매우 중요하다.

그래서 우리는 영(귀무)가설을 가정한 이론적 분포를 연급함으로써 이들 확률을 결정한다.
이 확률의 목표는 기각 및 채택을 위한 기준점(임계값)을 주기 위한 것이다.

 

 

[예시]

귀무가설: 도시 학생의 수학성적은 지방학생과 차이가 없다.
귀무가설(검정용): 도시학생의 수학 성적은 60점이다. (60점 = 지방학생의 수학 성적 평균 미리 구함)


도시 학생의 수학 성적을 구했는데, 기준점 밖에 있으면 귀무가설 기각, 이 안에 있으면 채택.

아래 그래프에서 평균 0을 60이라 두고 해석하면, 도시 학생의 성적이 기각영역에 있는지 채택영역에 있는지 살펴보면 된다.

 

자. 우리는 귀무가설을 기각하는 게 목적이었다.
귀무가설을 기각하면, 내 연구 가설에 힘이 생기는거다.

 

이렇게 귀무가설을 채택할지 기각할지 검정하는 과정을 귀무가설의 유의성 검정이라고 부른다. 

(참, 거짓의 증명이라고 부르지 못하는 이유를 이해하겠는가? '가설의 유의성 검정'은 '가설의 참, 거짓 판단'에 대한 통계적으로 수정된 용어라고 이해하자.)


아래 정규분포 그래프는 귀무가설의 유의수준을 보여주는 거라고 보자. (평균으로 0이 입력됨, 정규니까)

 


우리가 정한 이론적 확률과 기준점에 따라
보라색 색칠 부분이 기각영역이 됐다 치자.

만약 표본평균이 보라색 영역에 위치하면 우리의 귀무가설은 기각된다.

도시학생 점수(빨간색 분포)가 80점이어서 우리가 정한 기준점 밖에 있으면 기각됨.



앞에서도 언급했지만
어디까지나 우리는 통계적 추론을 하고 있는 상황이다.
그렇기 때문에,
귀무가설이 기각됐다고 해서, 반증을 통한 대립가설의 입증이 이루어졌다고 말할 수 없지.

 

우리는 통계적 유의성 검정을 통해 참, 거짓을 판단한다.

참이나 거짓이라고 말하면 안되지만

머뭇머뭇 하다가는 아무것도 못한다. 

그래서 신뢰구간 안에서 참, 거짓을 판단하게 되고, 

따라서, 오류 가능성을 안고 있다. 

 

그렇기 때문에, 주의점으로 1종 오류, 2종 오류를 언급하거나 검토하게 된다.


1종오류란

귀무가설이 참인데, 기각해 버린 경우

(도시학생의 수학 성적이 지방학생의 수학성적과 차이가 없는게 참인데, 차이가 있다고 봄)

알파()로 표기 하고 유의수준이라 함. 

 

통계 검정시 유의수준은 보통 1%, 5%로 설정한다. 이것이 유의수준(significance level)이다. 

 

 

2종오류란

귀무가설이 거짓인데, 채택한 경우이다.

(도시학생의 수학 성적이 지방학생의 수학성적과 차이가 있는게 참인데, 차이가 없다고 봄)

베타()로 표기하고 검정력이라 함. 

 

이것은 가설의 검정력(Statictical power)와 연관된다. 

 

 

보통 1종오류를 범하는 것이 더 위험하다고 본다. 때문에, 보통 1종오류를 줄이는 방향으로 결과를 분석한다. 

(연구 논문에서 알파가 자주 언급되는 이유)

 

 

예를들어 다음 두 가지를 비교해 보자. 

영재판별 시험을 개발했다 치자. 

이때, 

귀무가설은 땡땡 시험은 영재 판별에 효과가 없다.가 될 것이고

대립가설은 땡땡 시험은 영재 판별에 효과가 있다. 가 될 것이다.

귀무가설이 참인데, 기각한 경우와 귀무가설이 거짓인데 채택한 경우를 비교해 보자. 

 

1종 오류: 땡땡 시험은 영재성 판별에 효과가 없다가 참인데, 가설을 기각한다. 

 

2종 오류: 땡땡 시험은 영재성 판별에 효과가 없다가 거짓인데, 가설을 채택한다.

 

 

 

1종 오류시에

땡땡 시험이 영재판별에 효과가 없는데, 가설이 기각되면서 효과가 있는 것으로 판단되어 판별시험에 사용되게 된다.

즉, 잘못된 시험지가 영재판별에 이용된다.

2종 오류시에는 

땡땡 시험이 영재판별에 효과가 있는데, 효과 없다는 가설이 채택되어 판별시험에 사용되지 못한다.

즉, 잘된 시험지가 영재판별에 이용되지 않는다. 

 

무엇이 더 위험해 보이는가? 

 

당연히 1종 오류가 더 위험해 보인다. 

따라서 알파(유의 수준)가 통계 연구에서 더 자주 언급된다.

 

 

이상 추론 통계에서 가설의 역할과 유의성 검정의 의미에 대해서 살펴 보았다.