앞서 살펴본 상관분석의 통계학적 기초에 이어, 상관계수와 공분산에 대한 R 에서의 실행을 살펴보려 한다.
2019/12/31 - [공부하記/통계학] - 통계학 기초 - 상관분석
예제로 사용하는 데이터는 보스톤시의 한 공원에서 10일동안 공원에서 해당 일에 근무중인 방범대원의 수(x)와 보고된 좀도둑의 건수(y)이다. 두 데이터간의 상관계수와 공분산을 살펴보자.
# 데이터
> x <- c(10, 15, 16, 1, 4, 6, 18, 12, 14, 7)
> y <- c(5, 2, 1, 9, 7, 8, 1, 5, 3, 6)
# 산점도
> plot(x, y)
# 표본상관계수
> cor(x, y)
# 표본공분산
> cov(x, y)
# 표본공분산 = 표본상관계수 * x의 표준편차 * y의 표준편차
> cor(x, y) * sd(x) * sd(y)
표본상관계수가 -0.9690786로 음의 상관관계가 강하게 나타남을 알 수 있다.
'해보記 > R' 카테고리의 다른 글
<記> R 스타일 가이드 (0) | 2019.12.30 |
---|---|
<記> R 위치 측도와 산포 측도 (0) | 2019.12.23 |
<記> R 데이터 반복문 - for, while, repeat, apply, aggregate (1) | 2019.12.18 |
<記> R 데이터 조건문 - if/ifelse, switch (0) | 2019.12.18 |
<記> R 함수 - 기타 (1) | 2019.12.17 |