ㅇ 히스토그램 (Histogram)
값의 각 범위에 포함된 데이터 요소의 분포를 나타내기 위한 시각화 방법
표로 되어 있는 도수 분포를 그래프로 나타낸 것
R을 처음으로 사용하는 장이네요...
> hist(employees$인상률, breaks=50) #인상률에 대한 히스토그램 그리기
> sd(employees$인상률) #인상률에 대한 표준편차 구하기
> summary(employees$인상률) #인상률에 대한 요약 통계 구하기
#(최소값, 1분위값, 중간값, 평균값, 3분위값, 최대값)
> hist(employees$인상률[employees$년도 == 2007], breaks=50) #2007년도 인상률로만 히스토그램 그리기
히스토그램은 데이터의 분포가 어떻게 되어있는지 시각적으로 쉽게 확인할 수 있도록 해준다.
데이터를 분류하고, 분류에 따른 각각의 히스토그램을 그려보고 각 분류가 가지는 상관관계를 추정해 보는 것은 시각화를 통하여 데이터를 분석하는 기본적인 방법 중에 하나이다.
'읽記 (데이터 과학, IT 분야) > Head First Data Analysis' 카테고리의 다른 글
[HFDA] 11. 오류 / 오류를 잘 처리하다 (0) | 2019.11.18 |
---|---|
[HFDA] 10. 회귀 / 예측 (0) | 2019.11.18 |
[HFDA] 8. 휴리스틱 분석 / 인간처럼 분석한다 (0) | 2019.11.18 |
[HFDA] 7. 주관적 확률 / 숫자에 대한 믿음 (0) | 2019.11.18 |
[HFDA] 6. 베이지안 통계 / 첫 걸음을 내딛다 (0) | 2019.11.18 |