통계적 추론(statistical inference)

모집단으로부터 표본을 추출하여 모수(알려져 있지 않은 상수)에 대한

여러 가지 정보를 얻기 위한 일련의 과정

추정(estimation) + 가설검정(test of hypotheses)

 

추정

점추정(point estimation) + 구간추정(interval estimation)



점추정 

(4)번의 경우 표본의 표준편차는가 모수이기 때문에 추정치 s를 사용한다.

표준오차(s.e) = 표본표준편차(s.d)의 추정치 

 

(5)임의표본이 성공의 확률 p인 베르누이 시행을 따를 경우

모비율 에 대한 점 추정치는  


불편추정치


 


구간추정 (대표본, n>25, 정규분포근사)

대표본의 경우 근사적으로 정규분포를 따른 다는 것 유념

= 추정값의 하한

= 추정값의 상한

 = 신뢰수준(confidence level) =모수가 추정값의 상한과 하한사이에 위치할 확률

 = 유의수준(significance level)


신뢰구간의 의미

10번의 표본추출 통해 10번의 구간추정을 하였을 때,

추정한 구간 내에 모수가 존재할 확률이 90% 라면,

이를 90%신뢰구간, 10%신뢰수준이라고 말 할 수 있다.

 

모수에 대한 신뢰구간 구하기 

(경우1) n > 25 인 임의 표본 X1, ... Xn이 평균이이고 분산이 인 모집단으로부터 추출된 표본 

 

(경우2) X1,...,Xn은 성공확률이 p인 베르누이 시행이고, np >15 , n(1-p) > 15를 만족 

확률변수 X는 이항분포를 따르고, np>15, nq >15 조건에 따라 근사적으로 정규분포를 따른다.


계산과정(모비율은 알수 없으므로, 점추정치로 대체한다.)


모비율에 대한 신뢰구간


구간추정 (소표본, n<=25, student's-t분포)

임의표본이 반드시 정규분포를 따른다는 가정이 필요하다. 

student's t-분포


를 모르기 때문에 그 추정치인 s를 사용하는데, 이렇게 되면 정규분포를 따르는 것이 아닌 student's-t분포를 따른다.

 

자유도(degree of freedom (d.f.)

관측치 수 - 제약 조건의 개수


t분포는 정규분포에 비해 분산이 높은 모양이다.

정규분포에 비해 평평하고 꼬리가 두껍다(heavy -tailed distribution).

자유도가 증가할수록 정규분포에 가까워진다.

  

모수에 대한 신뢰구간 구하기



참조: K-MOOC R을 활용한 통계학 개론 김충락교수님 자료

네이버 지식백과

위키백과


+ Recent posts