읽記 (데이터 과학, IT 분야)/Head First Data Analysis

[HFDA] 9. 히스토그램 / 숫자의 모양

Light Pillar 2019. 11. 18. 13:54

 히스토그램 (Histogram)

값의 각 범위에 포함된 데이터 요소의 분포를 나타내기 위한 시각화 방법

표로 되어 있는 도수 분포를 그래프로 나타낸 것

 


R을 처음으로 사용하는 장이네요...

R 스크립트 실행 - 설치부터 실행까지


 

 

> hist(employees$인상률, breaks=50)    #인상률에 대한 히스토그램 그리기

 

> sd(employees$인상률)                     #인상률에 대한 표준편차 구하기

 

> summary(employees$인상률)            #인상률에 대한 요약 통계 구하기

                                                     #(최소값, 1분위값, 중간값, 평균값, 3분위값, 최대값)

 

> hist(employees$인상률[employees$년도 == 2007], breaks=50)    #2007년도 인상률로만 히스토그램 그리기

 

 

히스토그램은 데이터의 분포가 어떻게 되어있는지 시각적으로 쉽게 확인할 수 있도록 해준다.

데이터를 분류하고, 분류에 따른 각각의 히스토그램을 그려보고 각 분류가 가지는 상관관계를 추정해 보는 것은 시각화를 통하여 데이터를 분석하는 기본적인 방법 중에 하나이다.

 

 

[HFDA] 0. 목차