ML
데이터 정규화, 이상치 - Min-max scaling
ta_chan
2024. 9. 23. 20:12
강의 링크 : https://www.udemy.com/course/statsml_x/
- 어떻게 특정한 범위의 데이터를 스케일링하는지(특히[0,1])
- 왜 min-max 스케일링이 유용한지
Min-max scaling: the main idea
- 데이터를 0~1사이의 값으로 변환 - > min-max 스케일링 -> 유니티 정규화 데이터
- 유니티 정규화 데이터(unity norm data) -> 데이터가 0~1까지의 범위를 가진다는것을 의미
- z-score와 동일하게 데이터의 상대적 값을 변경하지 않는다 -> 무손실변환
- 하지만 z-score와는 달리 그래프의 단위는 표준편차 단위가 아니다
Min-max scaling: the Formula
Scale to a range of 0 to 1 :
$$\tilde{x}=\frac{x-\min_\space x}{\max_\space x - \min_ \space x}$$
Scale to a range of a to b: