가설(hypothesis)

아직 증명되지 않은 문제에 대하여 문장으로 설정한 것

 

통계적 가설

가설의 참과 거짓을 귀납법, 연역법 등으로 증명할 수 없고

관련된 통계자료를 이용하여 가장 가능성이 높은 결론을 내리고자 하는 것

오류를 반드시 수반하지만 오류를 최소화 하는 것이 목표이다.

 

통계적 가설 검정의 절차

1. 귀무가설과 대립가설을 세운다.

H0 : 부정하고 싶은 문장(귀무가설 :null hypothesis)

H1 : 주장하고 싶은 문장(대립가설 : alternative hypothesis)

 

2. 검정통계량을 선택한다.

검정통계량(test statistic)

귀무가설의 기각 여부를 결정하는데 사용되는 통계량

 

3. 기각역을 설정한다.

기각역(rejection region)

귀무가설이 기각되는 영역


4. 검정통계량과 기각역을 비교하여 가설을 검정한다.

 

통계적 가설 검정의 오류를 범할 확률

= 제1종 오류를 범할 확률

제1종 오류 = 귀무가설이 맞음에도 귀무가설을 기각하는 오류

= 제2종 오류를 범할 확률

제2종 오류 = 귀무가설이 틀림에도 귀무가설을 기각하지 않는 오류

1- = 검정력 (power of test) = 실제로 귀무가설이 틀렸을때, 올바르게 대립가설을 선택할 확률



가설검정 최적화

 와 를 최소화 시키는 검정법이 최적의 가설검정이다.

자료의 크기가 정해져 있다면  와  모두 최소화 하는 것은 불가능하다.

-> 를 작은 값으로 고정시킨 후 검정력(1- )를 최대화 시킨다.

 

유의수준 가 주어졌을 때 기각역 계산하기

즉, 귀무가설의 검정통계량이 유의수준 에서 기각역보다 큰 값인 경우,

유의수준 에서 귀무가설을 기각할 수 있다.

 


통계적 가설검정과 판사의 판결 비교

 

대립가설 형태와 기각역 설정



유의확률(p-value)

주어진 검정통계량을 기각시키기 위한 제1종오류 의 최소값

즉, 다시말해 귀무가설을 기각한 선택이 잘못되었을 확률을 의미한다.


 

유의 확률을 활용한 가설 검정

1. 유의확률이 작을수록 귀무가설을 기각할 수 있는 정당성이 커진다.

2.  > p-value 라면, 주어진 유의수준 에서 귀무가설 기각

3.  < p-value 라면, 주어진 유의수준 에서 귀무가설 채택

 

유의 확률에 따른 유의성 




참조 : K-MOOC [A.I. SERIES] R을 활용한 통계학개론 김충락교수님 자료,

네이버 지식백과

위키백과


+ Recent posts