강의 링크 : https://www.udemy.com/course/statsml_x/

문제시 삭제합니다.

Descriptive statistics(기술통계) - 분석

표본 데이터셋 또는 어떤 데이터셋의 특성을 나타내는개별 숫자를 얻는 것

  • 평균, 중앙값, 최빈값
  • 분산
  • 첨도(정규분포보다 얼마나 중앙에 몰려있는지/뾰족한지), 왜도(분포가 얼마나 한쪽으로 치우쳐져 있는지(중앙에 몰릴수록 낮은 값))
  • 분포 형태
  • 스펙트럼

모집단과 관계 없으며, 다른 데이터셋이나 그룹으로의 일반화도 없음

Inferential sttistics(추론통계) - 검증

데이터셋의 특징을 사용하여 모집단에 대한 주장을 함

  • p-value
  • T/F/카이제곱 value
  • 신뢰구간
  • 가설검정

전체 목적은 데이터 특징을 모집단이나 다른 그룹으로 일반화 하는것

 

 

p-value : 어떤 사건(관찰된 값)이 우연히 발생할확률/ 귀무가설 혹은 영가설(주로 '차이가 없다', '효과가 없다'라고 주장하는 가설)이 참일 확률 
t-value : 두 표본 집단이 평균적으로 얼마나 차이가 나는가를 표현한 정도(값이 클 수록 두 집단의 특성은 다르다)/ 두 집단의 평균 크기를 나타내는 통계량

f-value : 세 개 이상의 표본집단에서 얼마나 차이가 나는가/ 평균이 통계적으로 같지 않다는 것을 검증할 때 사용

+ Recent posts