강의 링크 : https://www.udemy.com/course/statsml_x/

Unstandardized statistical moments

** Unstandardized : 표준화되지 않은

General formula : $$m_k = n^{-1}\sum^n_{i=1}(x_i-\overline{x})^k$$

First moment : mean $$m_1 = n^{-1}\sum^n_{i=1}x_i$$
Second moment: variance $$m_2 = n^{-1}\sum^n_{i=1}(x_i-\overline{x})^2$$Third moment : skewness
** skewness(비대칭도/왜도) : 데이터 분포의 대칭성이 얼마나 결핍되었는지
$$m_3 = (n\sigma^3)^{-1}\sum^n_{i=1}(x_i-\overline{x})^3$$

Fourth moment: kurtosis
** kurtosis(첨도) : 그래프 꼬리의 굵기 / 분포에 존재하는 outlier의 척도
$$m_4 = (n\sigma^4)^{-1}\sum^n_{i=1}(x_i-\overline{x})^4$$


First moment: mean

$$m_1 = n^{-1}\sum^n_{i=1}x_i$$

Mean: Average value

Second moment : variance

$$m_2 = n^{-1}\sum^n_{i=1}(x_i-\overline{x})^2$$

Variance: Dispersion

Third moment : skewness

$$m_3 = (n\sigma^3)^{-1}\sum^n_{i=1}(x_i-\overline{x})^3$$

Skewness: Dispersion asymmetry

** asymmetry : 비대칭

  • 왜도의 방향 = 데이터 값을 이상치 범위로 끌어당기는 방향을 나타냄
  • 이상치가 오른쪽에 있으므로, positive, right skew
  • 이상치가 왼쪽에 있으므로 negative, left skew

Fourth moment : kurtosis

$$m_4 = (n\sigma^4)^{-1}\sum^n_{i=1}(x_i-\overline{x})^4$$

Kurtosis: Tail "fatness"

  • 꼬리가 굵어서 high kurtisis
  • 꼬리가 얇아서 low kurtosis

+ Recent posts