- 자료를 크기순서대로 나열했을 때 중간에 있는 값 - 순서통계량(order statistics): 표본을 오름차순으로 정렬한 것 $$(x_1<x_2<...<x_n)$$ ex) 8명의 졸업생의 월급 자료 225, 230, 240, 265, 265, 270, 275, 500
-표본 중앙값은 $$ (265+265)/2 = 265 $$ - 표본 중앙값은 극단적인 값에 영향을 받지 않음 - 이상점의 유무에 관계없이 안정적인 중심위치 제공 > 이상점에 로버스트 함 - 중앙에 있는 하나 또는 두 개의 값만 사용되므로 자료의 정보를 다 활용하지 못함
2. 중심위치의 사용 (평균과 중앙값 중)
-평균과 중앙값 중에서 평균이 중앙값과 유사하다면 평균을 사용한다 -평균과 중앙값을 계산하여 차이가 크지 않으면 평균을, 차이가 크면 중앙값을 사용
3. 표본절사평균(sample trimmed mean)
- 표본평균은 모든 자료의 정보를 사용하지만 이상점에 로버스트 하지 않음 - 표본중앙값은 로버스트 하지만 자료의 정보를 다 활용하지 못함 - a% 표본절사평균: 순서통계량에서 하위 a%부터 상위 a%까지의 자료를 이용하여 표본평균을 계산 - a백분위수(percentile): 하위 a %에 해당하는 값 - $$p = a/100 이면 p분위수$$
-표본평균 : a = 0 -표본중앙값 : a = 50
4. 표본최빈값(sample mode)
:자료 중 빈도가 가장 많은 값
- 취업률: 55.6 (3개), 초임임금: 265 (2개) - 최빈값은 여러 개가 나올 수 있음 - 연속자료의 경우 없을 수도 있음