새로운 시각화 정보를 볼 때는 가장 먼저
"시각화 정보의 뒷면에는 어떤 데이터가 있는가?"라는 의문을 가져야 한다.
"뛰어난 데이터 분석은 데이터 검토로 시작해서 데이터 검토로 끝난다."
ㅇ 뛰어난 시각화란?
- 데이터를 나타낸다 (데이터 직관화가 높을수록)
- 적절한 비교를 한다 (인과관계 또는 상관관계를 파악할 수 있도록)
- 여러 변수를 나타낸다 (다변량 시각화. 세 개 이상의 변수를 다루는 경우, 동일 형식으로 여러 결과를 한 번에 표현)
ㅇ 산포도(산점도)
탐색적 데이터 분석을 위한 도구로, 검증해야 할 가설을 찾기 위해 데이터를 둘러보는 것을 의미한다.
어떤 변수가 다른 변수에 영향을 줄 경우의 인과관계(즉 상관관계)를 조사할 때 산포도 사용을 선호한다.
일반적으로 X축은 독립 변수(영향을 미치는 변수, 원인), Y축은 종속 변수(영향을 받는 변수, 결과)를 나타낸다.
'읽記 (데이터 과학, IT 분야) > Head First Data Analysis' 카테고리의 다른 글
[HFDA] 6. 베이지안 통계 / 첫 걸음을 내딛다 (0) | 2019.11.18 |
---|---|
[HFDA] 5. 가설검정 / 그렇지 않다고 말해줘 (0) | 2019.11.18 |
[HFDA] 3. 최적화 / 최대한 가져가기 (0) | 2019.11.18 |
[HFDA] 2. 실험 / 이론을 검증하라 (0) | 2019.11.18 |
[HFDA] 1. 데이터 분석 입문 / 잘게 쪼개라 (0) | 2019.11.18 |