강의 링크 : https://www.udemy.com/course/statsml_x/
Unstandardized statistical moments
** Unstandardized : 표준화되지 않은
General formula : mk=n−1n∑i=1(xi−¯x)k
First moment : mean m1=n−1n∑i=1xi
Second moment: variance m2=n−1n∑i=1(xi−¯x)2Third moment : skewness
** skewness(비대칭도/왜도) : 데이터 분포의 대칭성이 얼마나 결핍되었는지
m3=(nσ3)−1n∑i=1(xi−¯x)3
Fourth moment: kurtosis
** kurtosis(첨도) : 그래프 꼬리의 굵기 / 분포에 존재하는 outlier의 척도
m4=(nσ4)−1n∑i=1(xi−¯x)4
First moment: mean
m1=n−1n∑i=1xi

Second moment : variance
m2=n−1n∑i=1(xi−¯x)2

Third moment : skewness
m3=(nσ3)−1n∑i=1(xi−¯x)3
** asymmetry : 비대칭

- 왜도의 방향 = 데이터 값을 이상치 범위로 끌어당기는 방향을 나타냄
- 이상치가 오른쪽에 있으므로, positive, right skew
- 이상치가 왼쪽에 있으므로 negative, left skew
Fourth moment : kurtosis
m4=(nσ4)−1n∑i=1(xi−¯x)4

- 꼬리가 굵어서 high kurtisis
- 꼬리가 얇아서 low kurtosis

'ML' 카테고리의 다른 글
데이터 정규화, 이상치 - Z-score standardization (0) | 2024.09.23 |
---|---|
기술통계 - Shanon entropy (0) | 2024.09.23 |
기술통계 - QQ plots(quintile-quintile) (1) | 2024.09.23 |
기술통계 - 사분범위 (0) | 2024.09.23 |
기술통계 - 산포 측정 (분산, 표준 편차) (0) | 2024.09.22 |