강의 링크 : https://www.udemy.com/course/statsml_x/
문제시 삭제합니다.
Descriptive statistics(기술통계) - 분석
표본 데이터셋 또는 어떤 데이터셋의 특성을 나타내는개별 숫자를 얻는 것
- 평균, 중앙값, 최빈값
- 분산
- 첨도(정규분포보다 얼마나 중앙에 몰려있는지/뾰족한지), 왜도(분포가 얼마나 한쪽으로 치우쳐져 있는지(중앙에 몰릴수록 낮은 값))
- 분포 형태
- 스펙트럼
모집단과 관계 없으며, 다른 데이터셋이나 그룹으로의 일반화도 없음
Inferential sttistics(추론통계) - 검증
데이터셋의 특징을 사용하여 모집단에 대한 주장을 함
- p-value
- T/F/카이제곱 value
- 신뢰구간
- 가설검정
전체 목적은 데이터 특징을 모집단이나 다른 그룹으로 일반화 하는것
p-value : 어떤 사건(관찰된 값)이 우연히 발생할확률/ 귀무가설 혹은 영가설(주로 '차이가 없다', '효과가 없다'라고 주장하는 가설)이 참일 확률
t-value : 두 표본 집단이 평균적으로 얼마나 차이가 나는가를 표현한 정도(값이 클 수록 두 집단의 특성은 다르다)/ 두 집단의 평균 크기를 나타내는 통계량
f-value : 세 개 이상의 표본집단에서 얼마나 차이가 나는가/ 평균이 통계적으로 같지 않다는 것을 검증할 때 사용
'ML' 카테고리의 다른 글
기술통계 - 중심 경향치 측정(평균) (0) | 2024.09.22 |
---|---|
기술통계 - 정확도, 정밀도, 해상도 (0) | 2024.09.22 |
데이터 시각화 - 바 플롯 대신 라인 플롯을 써야할 때 (0) | 2024.09.21 |
데이터 시각화 - 히스토그램 (0) | 2024.09.21 |
데이터 시각화 - box plot(Box-and-whiskers plot) (0) | 2024.09.21 |