평균 (Mean) 과 중앙값(정중값; median)

참고로 mean 과 median은 모두 집단을 대표할수 있는 통계치이나 연간 수입과 같이 극도의 예외 (극도의 고소득, 극도의 저소득) 가 많은 경우에는 mean 보다는 median 이 더 집단을 잘 대표한다고 할 수 있다.

평균(mean)과 표준편차(standard deviation)는 데이터가 동간이나 비율척도이고 정상분포를 이룰 때 계산하는 것이 적절한 반면에, 중앙값( median )과 범위(range)는 데이터가 서열척도이거나 편포되어(skewed) 있을 때 적당하다.

어떤 데이터에 대해서는 특정의 기술통계치가 다른 것들보다 더 적절한 경우가 있다. 예를 들어, 예컨대, 아주 높은 급여를 받는 사람들이 특정 몇몇 사람들에게 편포되어 있다면 평균을 계산하는 것은 일반적인 급여를 나타내는 좋은 측정치라고 할 수 없다.

예를 들어서 야구선수나 연예인 의 연봉을 말할때 mean을 말하면 오해의 소지가 큽니다. 만일 한국 프로야구 선수의 연봉평균을 7000만원 이라고 한다면 median은 그보다도 적은 4000 만원 정도가 된다.(실제 자료는 아니고 예를 들자면) 이러한 현상이 생기는 것은 몇몇 고액연봉자가 평균을 많이 올리기 때문이다. 그래서 연봉과 같은 것을 말할때는 median이 훨씬 적절하게 집단을 나타낼 수 있는 수치가 되겠지요. 

그리고 한국 신문에서 가구 당 연간 수입 평균이 어쩌구 저쩌구는 약간 과장되어 있다고 보아야 한다. (median이 아닌 평균을 사용하므로). 만일 median을 사용한다면 좀 낮아 지겠지요.