정형화된 데이터 요소 Elements of Structured Data
- 데이터의 출처
- 센서 측정: IoT
- 이벤트
- 이미지
- 비디오
- 대부분의 데이터는 정형화되어 있지 않음
- 이미지: RGB(Red, Green, Blue) 색상 정보를 가지고 있는 픽셀의 집합
- 텍스트: 단어 또는 무의미한 문자를 순서대로 나열한 배열
- 방문 내역: 사용자가 앱이나 웹 페이지를 이용하면서 만들어낸 일년의 반응을 배열로 모아놓은 것
- 데이터 과학에서 가장 중요한 도전은
- 폭발적인 양의 가공되지 않은 원시 데이터raw data를 활용 가능한 형태의 정보로 변환하는 것
- 데이터 전처리data preprocessing 과정 중의 하나
- 통계 기법을 사용하기 위해서는
- 정형화되지 않은 원시 데이터를 가공하여 (마치 관계형 DB에서 추출한 것처럼) 정형화된 형태로 변환하거나
- 처음부터 통계 기법에 사용할 수 있도록 데이터를 수집하고 저장해야 한다
'탐색적 데이터 분석 (Exploratory Data Analysis)' 카테고리의 다른 글
자유도 degree of freedom (0) | 2019.09.03 |
---|---|
변이 추정 (0) | 2019.09.03 |
탐색적 데이터 분석의 소개 (0) | 2019.08.30 |
평균의 의미 (0) | 2019.07.24 |
도수분포표와 히스토그램 (0) | 2019.07.23 |