읽記 (데이터 과학, IT 분야)/Head First Data Analysis

[HFDA] 4. 데이터 시각화 / 그림은 여러분을 더 똑똑하게 만든다

Light Pillar 2019. 11. 18. 13:50

새로운 시각화 정보를 볼 때는 가장 먼저

"시각화 정보의 뒷면에는 어떤 데이터가 있는가?"라는 의문을 가져야 한다.

 

"뛰어난 데이터 분석은 데이터 검토로 시작해서 데이터 검토로 끝난다."

 

 

 뛰어난 시각화란?

  • 데이터를 나타낸다 (데이터 직관화가 높을수록)
  • 적절한 비교를 한다 (인과관계 또는 상관관계를 파악할 수 있도록)
  • 여러 변수를 나타낸다 (다변량 시각화. 세 개 이상의 변수를 다루는 경우, 동일 형식으로 여러 결과를 한 번에 표현)

 

 산포도(산점도)

 탐색적 데이터 분석을 위한 도구로, 검증해야 할 가설을 찾기 위해 데이터를 둘러보는 것을 의미한다.

 어떤 변수가 다른 변수에 영향을 줄 경우의 인과관계(즉 상관관계)를 조사할 때 산포도 사용을 선호한다.

 일반적으로 X축은 독립 변수(영향을 미치는 변수, 원인), Y축은 종속 변수(영향을 받는 변수, 결과)를 나타낸다.

 

 

[HFDA] 0. 목차