회귀분석

반응변수와 설명변수를 관측하여 회귀함수를 추정하는 것.

 

Y = 반응변수(response variable), 종속변수 (dependent variable)

X1,...,Xp : 공변량(covariates), 설명변수

: 오차항 (error term)

f() : 회귀함수 ( regression function)

 

두가지 형태의 모형

 

결정적(수학적) 모형 deterministic(mathematical)

input output의 관계가 오차 없이 명확

Y = f(X1,...,Xp)

 

통계적 모형 (Statistical)

output input에 의해 영향을 받는 경향을 보이나, 언제나 오차를 수반

Y = f(X1,...,Xp) + e


모수회귀모형(parametric regression model)

1.단순선형회귀모형(simple linear regression model) 

2.다중선형회귀모형(multiple linear regression model)

 

3.비선형회귀모형(non-linear regression model)

 

4.k-차 다항회귀모형(k-th degree polynomial regression model)

 

공변량은 한 개다. 

5. 로지스틱 회귀모형(logistic regression model)

반응변수가 이항분포를 따를 때

6. 로그선형모형(log-linear regression model)

반응변수가 포아송 분포를 따를 때

 

비모수회귀모형

회귀함수의 형태를 구체적으로 명시하지 않고 함수의 추정치를 계산

 

회귀모형의 구분

참모형(true model) : only God knows, 실제 모형을 뜻하지만 모르는 부분이다.

설정모형(postulated model) : 산점도를 보고 어떤 회귀모형을 따를지 예측하여 설정한다.

적합모형(fitted model) : 관측치에 대해 설정모형을 최적화 시킨다. 

 


참조 : K-MOOC [A.I. SERIES] R을 활용한 통계학개론 김충락교수님 자료,

네이버 지식백과

위키백과


 

 

 

+ Recent posts