공부하記 5

통계학 기초 - 상관분석

상관 분석(Correlation Analysis) 상관 분석은 연속적인 변수로 측정된 두 변수 간의 선형 관계를 분석하는 것으로, 상관 관계는 서열 척도, 등간 척도, 비율 척도로 측정된 변수들간의 관련성 정도를 알아보기 위한 것이다. 하나의 변수가 다른 변수와의 어느 정도 밀접한 관련성을 가지고 변화하는 가를 알아보기 위해 사용하는 것으로, 두 변수 간의 관련성을 구할 경우 단순상관관계를 실시하고, 부분 또는 편 상관관계는 어떤 변수를 통제한 상태에서 두 변수의 상관관계를, 중다 상관관계는 두 개 이상의 독립변수에 가중치를 부여하여 상관관계를 구하는 것이다. 척도와 변인 척도 특성 변인의 분류 변인의 특성 보기 비율척도 · 서열성, 동간성의 정보를 제공해줄 뿐 아니라, 절대영점(0)을 갖고 있는 척도로..

통계 용어 정리(3) - 비·비율·율, 퍼센트(%)·퍼센트포인트(%p), 변동률, 기여율·기여도

비(ratio) · 비율(proportion) · 율(rate)은 일반적으로 구별하여 사용하지 않고 있다. 하지만 엄밀히 개념적으로 구별되므로 이에 관한 정확한 의미를 알아둘 필요가 있다. 특히 인구와 관련된 통계에서 이 세 개념이 사용된 때는 각별한 주의가 필요하다. 비(ratio)는 두 개 숫자의 상대적 크기를 비교한 것으로 분자와 분모가 서로 독립적인 관계로 서로 다른 범주일 때 사용된다. A에 대한 B의 비는 B÷A 로 계산된다. 성비, 인구밀도(인구/면적) 등이 비에 해당한다. 비율(proportion)은 비의 특수한 형태로 분모에 분자가 포함된다. 전체 미혼자 중 남자 미혼자의 비율{남자 미혼자 / (남자 미혼자 + 여자 미혼자)}이 그 예이다. 율(rate)이란 특정기간 동안에 발생된 사건을..

통계 용어 정리(2) - 산포도

산포도 산포도란 대푯값을 중심으로 자료들이 흩어져 있는 정도를 의미한다. 이는 하나의 수치로서 표현되며 수치가 작을수록 자료들이 대푯값에 밀집되어 있고, 클수록 자료들이 대푯값을 중심으로 멀리 흩어져 있다. 산포도는 자료의 분포에 대한 정보를 제공해 주는데 자료의 평균이 같다고 하더라도 산포도에 따라 자료의 내용이나 성질이 달라질 수 있다. 따라서 여러 자료들의 특성을 서로 비교하기 위해서는 평균뿐만 아니라 자료들이 평균으로부터 어떻게 흩어져 분포하고 있는가를 알 필요가 있다. 평균과 특정 자료값의 차이를 편차(deviation)라고 한다. 각각의 자료 값들은 평균값의 양 쪽에 위치하는데 편차는 각각의 자료값에서 평균값을 빼주는 것으로 계산하므로, 양수 혹은 음수 값을 갖게 된다. 특히 편차가 0인 자료..

통계 용어 정리(1) - 대표값

통계학이라는 학문을 공부하기 이전에 통계, 통계학에서 사용되는 용어부터 정리하고 넘어가기로 하자. 낯선 나라에 가서 처음 배워야 하는 것이 그 나라 말을 구성하는 단어 이듯이 통계학이라는 낯선 나라의 단어인 용어들부터 확인하고, 익히고 해야 할 것이다. 본격적인 '통계학'으로 들어가기 전에 우선 '통계'라는 것에 대해서 살펴보기로 하자. 통계란 무엇인가? 사전적인 의미는 다음과 같다. 통계(統計) 1.수집된 자료를 정리하고 그 내용을 특징짓는 수치를 산정하여 일정한 체계에 따라 숫자로 나타냄 2.한데 몰아서 계산함 1. statistical 2. statistic 3. data 4. number 5. figure 그렇다면, 통계학이란 이 통계를 학문적으로 정리한 것, 통계를 다루는 학문이라 할 수있을 텐..

통계학 기초 - 자료의 생성, 모집단과 표본, 위치 측도와 산포 측도

통계학(Statistic)이란? 1) 문제에 대한 합리적인 답을 줄 수 있도록 숫자로 표시되는 정보를 수집하고 정리 2) 이를 해석하고 신뢰성 있는 결론을 이끌어 내는 방법을 연구하는 학문 모집단에서 제기된 문제에 대한 합리적인 답을 줄 수 있도록, 모집단의 성격을 잘 대변하는 표본에 속한 각각의 추출 단위로부터 특성값을 측정, 숫자로 변환한 후 이를 정리, 해석하여 모집단에 대한 신뢰성 있는 결론을 이끌어내는 방법을 연구하는 학문 추출단위 (Sampling unit) : 전체(모집단)를 구성하는 각 개체 특성값 (Characteristic) : 각 추출 단위의 특성을 나타내는 값. 예) 키, 나이, 수확량 등 모집단 (Population) : 통계적 분석의 대상이 된느 조사 대상 전부. 예) 대한민국 ..