통계학이라는 학문을 공부하기 이전에 통계, 통계학에서 사용되는 용어부터 정리하고 넘어가기로 하자.
낯선 나라에 가서 처음 배워야 하는 것이 그 나라 말을 구성하는 단어 이듯이 통계학이라는 낯선 나라의 단어인 용어들부터 확인하고, 익히고 해야 할 것이다.
본격적인 '통계학'으로 들어가기 전에 우선 '통계'라는 것에 대해서 살펴보기로 하자.
통계란 무엇인가? 사전적인 의미는 다음과 같다.
통계(統計)
1.수집된 자료를 정리하고 그 내용을 특징짓는 수치를 산정하여 일정한 체계에 따라 숫자로 나타냄
2.한데 몰아서 계산함
1. statistical 2. statistic 3. data 4. number 5. figure
그렇다면, 통계학이란 이 통계를 학문적으로 정리한 것, 통계를 다루는 학문이라 할 수있을 텐데...
통계학(統計學)
임의로 취한 표본에서 얻은 수치 정보를 근거로 하여 집단이나 사회 현상을 관찰하고 처리하는 방법을 연구하는 학문
여하튼, 통계와 관련된 그 무엇이라도 하기 위한 기초상식(?)으로 다음의 용어들을 살펴보자.
대표값
주어진 자료를 대표하는 특정 값을 그 자료의 대표값이라고 한다. 대표값은 자료의 중심적인 경향이나 자료분포의 중심의 위치를 나타내주는데, 일반적 으로 사용되는 것에는 평균(mean), 중위수(median), 최빈수(mode) 등이 있다.
1. 평균(값)(mean)
평균은 산술평균, 기하평균, 조화평균, 가중평균 등으로 분류할 수 있다.
1.1. 산술평균(arithmetic mean)
일반적으로 평균 이라고 줄여말하는 것으로, 자료의 모든 측정값을 합산하여 이 값을 전체 자료의 수로 나누어 준 값을 말한다. 가장 보편적이고, 흔히 사용하는 값이다.
1.2. 기하평균(geometric mean)
변화하는 비율을 나타내는 평균이다.
예를 들어, 자본금 100만원 으로 사업을 시작하여 첫 해에는 자본금이 2배, 두 번째 해는 자본금이 8배 증가했다고 하자. 그러면 자본금은 2년 동안 총 16배가 늘어났고, 매년 평균 적으로 4배 늘어났다고 볼 수 있다. 이렇듯 기하평균은 여러 개의 수를 연속 으로 곱하여 그 개수의 거듭제곱근으로 구한다.
만약 이를 산술평균으로 구하면 2배와 8배의 산술평균 즉 5배가 되어 실제 평균증가율보다 높게 나타난다.
1.3. 조화평균(harmonic mean)
평균속도를 계산하거나 일정금액을 가지고 구입할 수 있는 상품의 수량의 평균을 구할 때 이용되는데, 자료값을 각각 역수로 하여 산술 평균을 구한 다음 다시 이 값의 역수를 취하여 산출한다.
1.4. 가중평균(Weighted Average)
각각의 자료값이 가지는 중요성이 서로 다르면, 자료값에 자료의 상대적 중요도인 가중치(w)를 곱하여 합산한 값을 각각의 가중치의 합계로 나누어 구한다. 가중평균은 물가지수 산정 등 광범위하게 사용되고 있다.
2. 중위(값)수(median)
중위수는 중앙값이라고도 하며, 자료를 크기 순으로 나열했을 때 한가운 데에 위치하는 자료값을 말한다.
자료가 홀수 개이면 정중앙 값이 중앙값이 되지만, 짝수 개이면 중앙에 위치한 값이 두 개가 되므로 이 경우에는 두 값의 평균을 중앙값으로 한다.
3. 최빈(값)수(mode)
자료 중 빈도수가 가장 높은 자료값을 말한다.
자료값이 7, 10, 10, 8, 9, 10, 6, 10로 주어졌다고 하자. 크기순대로 자료값을 다시 나열하면 6, 7, 8, 9, 10, 10, 10, 10이므로 중위수는 네 번째 값 9와 다섯 번째 값10의 평균인 9.5가 되며, 4번으로 가장 빈도수가 높은 10이 최빈수가 된다.
자료 중에 극단적인 값이 한 개 이상 있을 때 그 값들이 산술평균에 큰 영향을 미쳐서 산술평균이 대표값으로 부적절한 경우가 있다. 이런 경우에는 극단적인 값의 영향을 받지 않는 중위수나 최빈수가 오히려 대표값으로 적절 할 수 있다
- 통계청 자료로 '통계용어 · 지표의 이해'에서 발췌하였음
'공부하記 > 통계학' 카테고리의 다른 글
통계학 기초 - 상관분석 (0) | 2019.12.31 |
---|---|
통계 용어 정리(3) - 비·비율·율, 퍼센트(%)·퍼센트포인트(%p), 변동률, 기여율·기여도 (0) | 2019.12.30 |
통계 용어 정리(2) - 산포도 (0) | 2019.12.30 |
통계학 기초 - 자료의 생성, 모집단과 표본, 위치 측도와 산포 측도 (0) | 2019.12.22 |