ML

데이터 정규화, 이상치 - Min-max scaling

ta_chan 2024. 9. 23. 20:12

강의 링크 : https://www.udemy.com/course/statsml_x/

  • 어떻게 특정한 범위의 데이터를 스케일링하는지(특히[0,1])
  • 왜 min-max 스케일링이 유용한지

Min-max scaling: the main idea

  • 데이터를 0~1사이의 값으로 변환 - > min-max 스케일링 -> 유니티 정규화 데이터
  • 유니티 정규화 데이터(unity norm data) -> 데이터가 0~1까지의 범위를 가진다는것을 의미
  • z-score와 동일하게 데이터의 상대적 값을 변경하지 않는다 -> 무손실변환
  • 하지만 z-score와는 달리 그래프의 단위는 표준편차 단위가 아니다

Min-max scaling: the Formula

Scale to a range of 0 to 1 :

$$\tilde{x}=\frac{x-\min_\space x}{\max_\space x - \min_ \space x}$$

Scale to a range of a to b:

$$x^* = a+\tilde{x}(b-a)$$