통계적 추론(statistical inference)
모집단으로부터 표본을 추출하여 모수(알려져 있지 않은 상수)에 대한
여러 가지 정보를 얻기 위한 일련의 과정
추정(estimation) + 가설검정(test of hypotheses)
추정
점추정(point estimation) + 구간추정(interval estimation)
점추정
(4)번의 경우 표본의 표준편차는가 모수이기 때문에 추정치 s를 사용한다.
표준오차(s.e) = 표본표준편차(s.d)의 추정치
(5)임의표본이 성공의 확률 p인 베르누이 시행을 따를 경우
모비율 에 대한 점 추정치는
불편추정치
구간추정 (대표본, n>25, 정규분포근사)
대표본의 경우 근사적으로 정규분포를 따른 다는 것 유념
= 추정값의 하한
= 추정값의 상한
= 신뢰수준(confidence level) =모수가 추정값의 상한과 하한사이에 위치할 확률
= 유의수준(significance level)
신뢰구간의 의미
10번의 표본추출 통해 10번의 구간추정을 하였을 때,
추정한 구간 내에 모수가 존재할 확률이 90% 라면,
이를 90%신뢰구간, 10%신뢰수준이라고 말 할 수 있다.
모수에 대한 신뢰구간 구하기
(경우1) n > 25 인 임의 표본 X1, ... Xn이 평균이이고 분산이 인 모집단으로부터 추출된 표본
(경우2) X1,...,Xn은 성공확률이 p인 베르누이 시행이고, np >15 , n(1-p) > 15를 만족
확률변수 X는 이항분포를 따르고, np>15, nq >15 조건에 따라 근사적으로 정규분포를 따른다.
계산과정(모비율은 알수 없으므로, 점추정치로 대체한다.)
모비율에 대한 신뢰구간
구간추정 (소표본, n<=25, student's-t분포)
임의표본이 반드시 정규분포를 따른다는 가정이 필요하다.
student's t-분포
를 모르기 때문에 그 추정치인 s를 사용하는데, 이렇게 되면 정규분포를 따르는 것이 아닌 student's-t분포를 따른다.
자유도(degree of freedom (d.f.)
관측치 수 - 제약 조건의 개수
t분포는 정규분포에 비해 분산이 높은 모양이다.
정규분포에 비해 평평하고 꼬리가 두껍다(heavy -tailed distribution).
자유도가 증가할수록 정규분포에 가까워진다.
모수에 대한 신뢰구간 구하기
참조: K-MOOC R을 활용한 통계학 개론 김충락교수님 자료
네이버 지식백과
위키백과
'수학, 과학 관련 학습 > 통계학' 카테고리의 다른 글
통계학 : 가설검정 (0) | 2019.03.05 |
---|---|
통계학 : 포아송 분포 (0) | 2019.03.05 |
통계학 : 중심극한정리, 라플라스의 정리 (0) | 2019.03.04 |
통계학 : 베르누이 시행 (0) | 2019.03.04 |
통계학 : 왜도, 첨도 (0) | 2019.03.04 |