공분산(Covariance)

X의 편차, Y의 편차의 곱의 기대값

두 확률변수 X와 Y가 연관이 있어서 같이 증가하는지 감소하는지 연관의 정도를 측정,

만약 연관이 없다면(X와 Y는 독립적) 공분산은 0이다.

일반적으로 , 등으로 표기된다. 

공분산은 원자료 단위의 영향을 받는다. (상관계수를 사용하는 이유)

 

상관계수(coefficient of correlation)

공분산을 각 변수의 표준편차로 표준화한것

단위에 관계없이 두 변량 X, Y 사이의 상관관계의 정도를 비율로 나타내는 수치이다.

-1~1의 값을 가지며 값이 클수록 상관성이 높다.

일반적으로 표본상관계수는  모집단 상관계수는 를 사용한다.

 

참조: K-MOOC R을 활용한 통계학 개론 김충락교수님 자료

네이버 지식백과

위키백과



+ Recent posts