해보記/R

<記> R 상관계수와 공분산

Light Pillar 2020. 1. 1. 00:06

앞서 살펴본 상관분석의 통계학적 기초에 이어, 상관계수와 공분산에 대한 R 에서의 실행을 살펴보려 한다.

 


 

2019/12/31 - [공부하記/통계학] - 통계학 기초 - 상관분석

 

 

예제로 사용하는 데이터는 보스톤시의 한 공원에서 10일동안 공원에서 해당 일에 근무중인 방범대원의 수(x)와 보고된 좀도둑의 건수(y)이다. 두 데이터간의 상관계수와 공분산을 살펴보자.

# 데이터
> x <- c(10, 15, 16, 1, 4, 6, 18, 12, 14, 7)
> y <- c(5, 2, 1, 9, 7, 8, 1, 5, 3, 6)

 

# 산점도
> plot(x, y)

# 표본상관계수
> cor(x, y)
# 표본공분산
> cov(x, y)
# 표본공분산 = 표본상관계수 * x의 표준편차 * y의 표준편차
> cor(x, y) * sd(x) * sd(y)

표본상관계수가 -0.9690786로 음의 상관관계가 강하게 나타남을 알 수 있다.