강의 링크 : https://www.udemy.com/course/statsml_x/
- 어떻게 특정한 범위의 데이터를 스케일링하는지(특히[0,1])
- 왜 min-max 스케일링이 유용한지
Min-max scaling: the main idea
- 데이터를 0~1사이의 값으로 변환 - > min-max 스케일링 -> 유니티 정규화 데이터
- 유니티 정규화 데이터(unity norm data) -> 데이터가 0~1까지의 범위를 가진다는것을 의미
- z-score와 동일하게 데이터의 상대적 값을 변경하지 않는다 -> 무손실변환
- 하지만 z-score와는 달리 그래프의 단위는 표준편차 단위가 아니다
Min-max scaling: the Formula
Scale to a range of 0 to 1 :
$$\tilde{x}=\frac{x-\min_\space x}{\max_\space x - \min_ \space x}$$
Scale to a range of a to b:
$$x^* = a+\tilde{x}(b-a)$$
'ML' 카테고리의 다른 글
데이터 정규화, 이상치 - Removing outliers : z-score method (1) | 2024.09.23 |
---|---|
데이터 정규화, 이상치 - What are outliers and why are they dangerous? (0) | 2024.09.23 |
데이터 정규화, 이상치 - Z-score standardization (0) | 2024.09.23 |
기술통계 - Shanon entropy (0) | 2024.09.23 |
기술통계 - statistical moments (0) | 2024.09.23 |