Growth/통계

파이썬을 이용한 경제 및 금융데이터 분석

Diligejy 2023. 3. 18. 19:35

 

p.34

중앙값 절대편차(MAD: Median Absolute Deviation)

 

표준편차는 평균에 기초하여 데이터의 퍼진 정도를 측정하는 통계량입니다. 평균은 극단치의 영향을 많이 받기 때문에 표준편차 역시 극단치의 영향을 많이 받습니다. 극단치의 영향을 덜 받는 데이터의 퍼진 정도를 나타내는 통계량이 중앙값 절대편차입니다. 중앙값 절대편차는 데이터의 중앙값과 각 값과의 차이의 절대값들의 중앙값입니다.

 

MAD = median (| X_i - median(X)|)

 

MAD는 데이터 집합의 극단적인 값들에 민감하지 않은 특성 때문에 이상치 검출 등에서 사용되고 있습니다.