데이터 분포 탐색하기 Exploring the Data Distribution

  • 데이터 시각화(data visualization): 다양한 그래프를 활용하여 데이터의 분포를 확인
  • 데이터 분포 확인에 사용할 수 있는 그래프
    • 상자그림(box plot): Tukey가 데이터의 분포를 시각화하기 위해 간단한 방법으로 소개한 그림
    • 도수분포표(frequency table): 어떤 구간(interval) 또는 칸(bin)에 해당하는 데이터 값의 빈도를 기록한 표
    • 히스토그램(histogram): \(X\)축은 구간을, \(Y\)축은 빈도수를 나타낸 도수분포표의 그래프
    • 밀도그림(density plot): 히스토그램을 부드러운 곡선으로 나타낸 그림으로 커널밀도추정(KDE, Kernel Density Estimation)을 주로 사용



+ Recent posts