ML
데이터 정규화, 이상치 - The modified z-score method
ta_chan
2024. 9. 23. 20:23
강의 링크 : https://www.udemy.com/course/statsml_x/
- 비정규본포에 대한 z-score 대안
Modified Z-score for outliers
For non-normal distributions:
- z-score를 수정된 z-score로 대체한다.
- 이전 매서드를 반복한다.
- 긴꼬리 분포에 유용하다.
Modified Z-score for outliers
$$M_i = \frac{.6745(x_i-\overline{x})}{MAD}$$
- .6745 : 정규분포의 3번째 사분위수(Q3:데이터의 75%가 이 값보다 작거나 같음)에 해당하는 표준편차 단위$$MAD = median(|x_i-\overline{x}|)$$
- $$\overline{x} = median(x)$$