읽記 (데이터 과학, IT 분야)/Head First Data Analysis

[HFDA] 5. 가설검정 / 그렇지 않다고 말해줘

Light Pillar 2019. 11. 18. 13:51

변수는 음(-)의 상관관계도 있고 양(+)의 상관관계도 있다.

음(-)의 상관관계 : 어느 한쪽이 증가하면 다른 한쪽이 줄어드는 상관관계

양(+)의 상관관계 : 어느 한쪽이 증가하면 다른 한쪽도 증가하는 상관관계

 

각 변수 간의 양/음의 상관관계를 하나의 모델로 통합하여 모든 상관관계를 나타낼 수 있는 다이어그램을 그린다.

 

 

반증은 가설 검증의 기본

  • 반증 : 여러 가설 중 확인되지 않은 가설들을 제거하여 마지막 남는 가설을 선택하는 것
  • 만족화 : 여러 가설 중 가장 적당하다 생각되는 가설을 선택하는 것. 이때 다른 가설들을 배제하지 않는다
가설 검증을 할 때는 만족화의 위험을 피하기 위해 반증을 이용하는 게 좋다.

만족화의 가장 큰 문제점은 다른 대안을 충분히 분석하지 않고 가설을 선택함으로써 그에 반하는 증거가 수집되더라도 그 가설을 고수하려 하는 것이다.

반증은 가설을 좀 더 이성적인 관점에서 볼 수 있도록 하며, 인지의 함정에 빠지지 않도록 도와준다.

 

 진단 가능성

     - 증거가 검토 중인 가설의 상대적인 가능성을 평가하는데 도움을 줄 수 있는지의 여부를 나타내는 능력

     - 증거가 진단 가능성이 있는 경우에는 가설에 순위를 매길 수 있다.

     - 증거를 가장 약하게 부정하는 가설을 찾는 데 도움을 준다.

 

 

[HFDA] 0. 목차