강의 링크 : https://www.udemy.com/course/statsml_x/

문제시 삭제합니다.

히스토그램 vs. 바 플롯

  • 막대그래프는 x-axis에 카테고리가 있다.
  • 히스토그램의 x-axis는 bin이라는 연속적인 데이터로 되어있다.
  • 막대그래프는 x-axis의 순서를 변경해도 무관
  • 히스토그램은 x-axis의 순서를 변경하면 안됨(데이터 고유의 모양이고, 추세를 봐야하기 때문)

히스토그램 수량 vs. 비율

수량을 히스토그램으로

  • 해석 시 더 의미가 있을 수 있음
  • 데이터셋이나 연구에서 전체비교하기는 어렵다.
  • 총합이 1이 될 필요가 없다.
  • 보통 질적 검토에 적합하다.

*질적 검토 : 숫자로 분석하기 보다는 데이터를 시각적, 서술적, 그리고 해석적인 방식으로 평가하는 과정*

비율을 히스토그램으로

  • 원시 데이터와의 관계를 이해하거나 연결하는데 추가적인 노력이 필요함
  • 다른 데이터셋이나 연구와 비교하기 좋다.
  • 합이 1이 되어야만 한다.
  • 보통 정량적 분석에 적합하다.

수량을 비율로 변환하는 방법

히스토그램의 bins 수량은 어느정도가 적당한가?

  • 빈의 숫자는 데이터의 질, 특성에 따라 다르다.
  • 이들을 측정하기 위한 방정식들이 존재함.

+ Recent posts