긴 꼬리 분포 long-tailed distribution

  • 꼬리(tail): 적은 수의 극단값이 주로 존재하는 도수분포의 길고 좁은 부분
  • 왜도(skewness): 분포의 한쪽 꼬리가 반대쪽 꼬리보다 긴 정도
  • 대칭 또는비대칭 분포 모두 긴 꼬리(long-tail)을 가질 수 있다
  • 분포의 꼬리는 양 극한값에 해당
  • 실무에서 긴 꼬리와 긴 꼬리를 잘 들여보다는 것이 중요함
    • 나심 탈레브(Nassim Taleb): 주식시장의 붕괴와 같은 이례적인 사건이, 정규분포에 에측하는 것보다 더 자주 일어날 수 있다고 하는 흑고니 이론(black swan theory)를 제안
    • 주가 수익률은 데이터의 긴 꼬리 특성을 설명하기 위한 좋은 예
    • 넷플릭스(NFLX)의 일일 주식 수익률의 QQ 그림
      • 낮은 값의 점들은 대각선보다 훨씬 낮고 높은 값은 선보다 훨씬 위에 있다.
      • 데이터가 정규분포를 따른다고 할 때 예상되는 것보다 훨씬 더 많은 극단값을 관찰할 가능성이 있음을 의미
      • 평균에서 표준편차 안에 있는 점들든 선 가까이에 있다.








'탐색적 데이터 분석 (Exploratory Data Analysis)' 카테고리의 다른 글

이항 분포  (0) 2019.09.17
t-분포  (0) 2019.09.17
정규분포  (0) 2019.09.17
신뢰구간  (0) 2019.09.17
부트스트랩  (0) 2019.09.17

+ Recent posts