강의 링크 : https://www.udemy.com/course/statsml_x/
문제시 삭제합니다.
히스토그램 vs. 바 플롯
- 막대그래프는 x-axis에 카테고리가 있다.
- 히스토그램의 x-axis는 bin이라는 연속적인 데이터로 되어있다.
- 막대그래프는 x-axis의 순서를 변경해도 무관
- 히스토그램은 x-axis의 순서를 변경하면 안됨(데이터 고유의 모양이고, 추세를 봐야하기 때문)
히스토그램 수량 vs. 비율
수량을 히스토그램으로
- 해석 시 더 의미가 있을 수 있음
- 데이터셋이나 연구에서 전체비교하기는 어렵다.
- 총합이 1이 될 필요가 없다.
- 보통 질적 검토에 적합하다.
*질적 검토 : 숫자로 분석하기 보다는 데이터를 시각적, 서술적, 그리고 해석적인 방식으로 평가하는 과정*
비율을 히스토그램으로
- 원시 데이터와의 관계를 이해하거나 연결하는데 추가적인 노력이 필요함
- 다른 데이터셋이나 연구와 비교하기 좋다.
- 합이 1이 되어야만 한다.
- 보통 정량적 분석에 적합하다.
수량을 비율로 변환하는 방법
히스토그램의 bins 수량은 어느정도가 적당한가?
- 빈의 숫자는 데이터의 질, 특성에 따라 다르다.
- 이들을 측정하기 위한 방정식들이 존재함.
'ML' 카테고리의 다른 글
기술통계 - 기술통계 vs. 추론 통계 (1) | 2024.09.22 |
---|---|
데이터 시각화 - 바 플롯 대신 라인 플롯을 써야할 때 (0) | 2024.09.21 |
데이터 시각화 - box plot(Box-and-whiskers plot) (0) | 2024.09.21 |
데이터 시각화 - 바 플롯 (0) | 2024.09.21 |
데이터의 타입 (0) | 2024.09.21 |