공부하記/통계학

통계 용어 정리(1) - 대표값

Light Pillar 2019. 12. 28. 09:06

통계학이라는 학문을 공부하기 이전에 통계, 통계학에서 사용되는 용어부터 정리하고 넘어가기로 하자.

낯선 나라에 가서 처음 배워야 하는 것이 그 나라 말을 구성하는 단어 이듯이 통계학이라는 낯선 나라의 단어인 용어들부터 확인하고, 익히고 해야 할 것이다. 

 

본격적인 '통계학'으로 들어가기 전에 우선 '통계'라는 것에 대해서 살펴보기로 하자.

통계란 무엇인가? 사전적인 의미는 다음과 같다.

통계(統計)
1.수집된 자료를 정리하고 그 내용을 특징짓는 수치를 산정하여 일정한 체계에 따라 숫자로 나타냄
2.한데 몰아서 계산함

1. statistical  2. statistic  3. data  4. number  5. figure

그렇다면, 통계학이란 이 통계를 학문적으로 정리한 것, 통계를 다루는 학문이라 할 수있을 텐데...

통계학(統計學)
임의로 취한 표본에서 얻은 수치 정보를 근거로 하여 집단이나 사회 현상을 관찰하고 처리하는 방법을 연구하는 학문

여하튼, 통계와 관련된 그 무엇이라도 하기 위한 기초상식(?)으로 다음의 용어들을 살펴보자.

 

대표값

주어진 자료를 대표하는 특정 값을 그 자료의 대표값이라고 한다. 대표값 자료의 중심적인 경향이나 자료분포의 중심의 위치를 나타내주는데, 일반적 으로 사용되는 것에는 평균(mean), 중위수(median), 최빈수(mode) 등이 있다.

 

1. 평균(값)(mean)

평균은 산술평균, 기하평균, 조화평균, 가중평균 등으로 분류할 수 있다.

 

1.1. 산술평균(arithmetic mean)

일반적으로 평균 이라고 줄여말하는 것으로, 자료의 모든 측정값을 합산하여 이 값을 전체 자료의 수로 나누어 준 값을 말한다. 가장 보편적이고, 흔히 사용하는 값이다. 

 

 

1.2. 기하평균(geometric mean)

변화하는 비율을 나타내는 평균이다.

예를 들어, 자본금 100만원 으로 사업을 시작하여 첫 해에는 자본금이 2배, 두 번째 해는 자본금이 8배 증가했다고 하자. 그러면 자본금은 2년 동안 총 16배가 늘어났고, 매년 평균 적으로 4배 늘어났다고 볼 수 있다. 이렇듯 기하평균은 여러 개의 수를 연속 으로 곱하여 그 개수의 거듭제곱근으로 구한다.

만약 이를 산술평균으로 구하면 2배와 8배의 산술평균 즉 5배가 되어 실제 평균증가율보다 높게 나타난다.

 

 

1.3. 조화평균(harmonic mean)

평균속도를 계산하거나 일정금액을 가지고 구입할 수 있는 상품의 수량의 평균을 구할 때 이용되는데, 자료값을 각각 역수로 하여 산술 평균을 구한 다음 다시 이 값의 역수를 취하여 산출한다.

 

 

1.4. 가중평균(Weighted Average)

각각의 자료값이 가지는 중요성이 서로 다르면, 자료값에 자료의 상대적 중요도인 가중치(w)를 곱하여 합산한 값을 각각의 가중치의 합계로 나누어 구한다. 가중평균은 물가지수 산정 등 광범위하게 사용되고 있다.

 

 

2. 중위(값)수(median)

중위수는 중앙값이라고도 하며, 자료를 크기 순으로 나열했을 때 한가운 데에 위치하는 자료값을 말한다.

자료가 홀수 개이면 정중앙 값이 중앙값이 되지만, 짝수 개이면 중앙에 위치한 값이 두 개가 되므로 이 경우에는 두 값의 평균을 중앙값으로 한다.

 

 

3. 최빈(값)수(mode)

자료 중 빈도수가 가장 높은 자료값을 말한다.

 

자료값이 7, 10, 10, 8, 9, 10, 6, 10로 주어졌다고 하자. 크기순대로 자료값을 다시 나열하면 6, 7, 8, 9, 10, 10, 10, 10이므로 중위수는 네 번째 값 9와 다섯 번째 값10의 평균인 9.5가 되며, 4번으로 가장 빈도수가 높은 10이 최빈수가 된다. 

 

자료 중에 극단적인 값이 한 개 이상 있을 때 그 값들이 산술평균에 큰 영향을 미쳐서 산술평균이 대표값으로 부적절한 경우가 있다. 이런 경우에는 극단적인 값의 영향을 받지 않는 중위수나 최빈수가 오히려 대표값으로 적절 할 수 있다

 

 

 

- 통계청 자료로 '통계용어 · 지표의 이해'에서 발췌하였음