강의 링크 : https://www.udemy.com/course/statsml_x/
Unstandardized statistical moments
** Unstandardized : 표준화되지 않은
General formula : $$m_k = n^{-1}\sum^n_{i=1}(x_i-\overline{x})^k$$
First moment : mean $$m_1 = n^{-1}\sum^n_{i=1}x_i$$
Second moment: variance $$m_2 = n^{-1}\sum^n_{i=1}(x_i-\overline{x})^2$$Third moment : skewness
** skewness(비대칭도/왜도) : 데이터 분포의 대칭성이 얼마나 결핍되었는지
$$m_3 = (n\sigma^3)^{-1}\sum^n_{i=1}(x_i-\overline{x})^3$$
Fourth moment: kurtosis
** kurtosis(첨도) : 그래프 꼬리의 굵기 / 분포에 존재하는 outlier의 척도
$$m_4 = (n\sigma^4)^{-1}\sum^n_{i=1}(x_i-\overline{x})^4$$
First moment: mean
$$m_1 = n^{-1}\sum^n_{i=1}x_i$$
Second moment : variance
$$m_2 = n^{-1}\sum^n_{i=1}(x_i-\overline{x})^2$$
Third moment : skewness
$$m_3 = (n\sigma^3)^{-1}\sum^n_{i=1}(x_i-\overline{x})^3$$
** asymmetry : 비대칭
- 왜도의 방향 = 데이터 값을 이상치 범위로 끌어당기는 방향을 나타냄
- 이상치가 오른쪽에 있으므로, positive, right skew
- 이상치가 왼쪽에 있으므로 negative, left skew
Fourth moment : kurtosis
$$m_4 = (n\sigma^4)^{-1}\sum^n_{i=1}(x_i-\overline{x})^4$$
- 꼬리가 굵어서 high kurtisis
- 꼬리가 얇아서 low kurtosis
'ML' 카테고리의 다른 글
데이터 정규화, 이상치 - Z-score standardization (0) | 2024.09.23 |
---|---|
기술통계 - Shanon entropy (0) | 2024.09.23 |
기술통계 - QQ plots(quintile-quintile) (1) | 2024.09.23 |
기술통계 - 사분범위 (0) | 2024.09.23 |
기술통계 - 산포 측정 (분산, 표준 편차) (0) | 2024.09.22 |