ML
기술통계 - 기술통계 vs. 추론 통계
ta_chan
2024. 9. 22. 08:29
강의 링크 : https://www.udemy.com/course/statsml_x/
문제시 삭제합니다.
Descriptive statistics(기술통계) - 분석
표본 데이터셋 또는 어떤 데이터셋의 특성을 나타내는개별 숫자를 얻는 것
- 평균, 중앙값, 최빈값
- 분산
- 첨도(정규분포보다 얼마나 중앙에 몰려있는지/뾰족한지), 왜도(분포가 얼마나 한쪽으로 치우쳐져 있는지(중앙에 몰릴수록 낮은 값))
- 분포 형태
- 스펙트럼
모집단과 관계 없으며, 다른 데이터셋이나 그룹으로의 일반화도 없음
Inferential sttistics(추론통계) - 검증
데이터셋의 특징을 사용하여 모집단에 대한 주장을 함
- p-value
- T/F/카이제곱 value
- 신뢰구간
- 가설검정
전체 목적은 데이터 특징을 모집단이나 다른 그룹으로 일반화 하는것
p-value : 어떤 사건(관찰된 값)이 우연히 발생할확률/ 귀무가설 혹은 영가설(주로 '차이가 없다', '효과가 없다'라고 주장하는 가설)이 참일 확률
t-value : 두 표본 집단이 평균적으로 얼마나 차이가 나는가를 표현한 정도(값이 클 수록 두 집단의 특성은 다르다)/ 두 집단의 평균 크기를 나타내는 통계량
f-value : 세 개 이상의 표본집단에서 얼마나 차이가 나는가/ 평균이 통계적으로 같지 않다는 것을 검증할 때 사용