데이터 분포 탐색하기 Exploring the Data Distribution
- 데이터 시각화(data visualization): 다양한 그래프를 활용하여 데이터의 분포를 확인
- 데이터 분포 확인에 사용할 수 있는 그래프
- 상자그림(box plot): Tukey가 데이터의 분포를 시각화하기 위해 간단한 방법으로 소개한 그림
- 도수분포표(frequency table): 어떤 구간(interval) 또는 칸(bin)에 해당하는 데이터 값의 빈도를 기록한 표
- 히스토그램(histogram): \(X\)축은 구간을, \(Y\)축은 빈도수를 나타낸 도수분포표의 그래프
- 밀도그림(density plot): 히스토그램을 부드러운 곡선으로 나타낸 그림으로 커널밀도추정(KDE, Kernel Density Estimation)을 주로 사용
'탐색적 데이터 분석 (Exploratory Data Analysis)' 카테고리의 다른 글
표본추출의 중요성 (0) | 2019.09.04 |
---|---|
상관분석 Correlation Analysis (0) | 2019.09.03 |
백분위수에 기반한 변이 추정 (2) | 2019.09.03 |
자유도 degree of freedom (0) | 2019.09.03 |
변이 추정 (0) | 2019.09.03 |