정형화된 데이터 요소 Elements of Structured Data

  • 데이터의 출처
    • 센서 측정: IoT
    • 이벤트
    • 이미지
    • 비디오

  • 대부분의 데이터는 정형화되어 있지 않음
    • 이미지: RGB(Red, Green, Blue) 색상 정보를 가지고 있는 픽셀의 집합
    • 텍스트: 단어 또는 무의미한 문자를 순서대로 나열한 배열
    • 방문 내역: 사용자가 앱이나 웹 페이지를 이용하면서 만들어낸 일년의 반응을 배열로 모아놓은 것

  • 데이터 과학에서 가장 중요한 도전은
    • 폭발적인 양의 가공되지 않은 원시 데이터raw data를 활용 가능한 형태의 정보로 변환하는 것
    • 데이터 전처리data preprocessing 과정 중의 하나

  • 통계 기법을 사용하기 위해서는
    • 정형화되지 않은 원시 데이터를 가공하여 (마치 관계형 DB에서 추출한 것처럼) 정형화된 형태로 변환하거나
    • 처음부터 통계 기법에 사용할 수 있도록 데이터를 수집하고 저장해야 한다


'탐색적 데이터 분석 (Exploratory Data Analysis)' 카테고리의 다른 글

자유도 degree of freedom  (0) 2019.09.03
변이 추정  (0) 2019.09.03
탐색적 데이터 분석의 소개  (0) 2019.08.30
평균의 의미  (0) 2019.07.24
도수분포표와 히스토그램  (0) 2019.07.23

+ Recent posts