긴 꼬리 분포 long-tailed distribution
- 꼬리(tail): 적은 수의 극단값이 주로 존재하는 도수분포의 길고 좁은 부분
- 왜도(skewness): 분포의 한쪽 꼬리가 반대쪽 꼬리보다 긴 정도
- 대칭 또는비대칭 분포 모두 긴 꼬리(long-tail)을 가질 수 있다
- 분포의 꼬리는 양 극한값에 해당
- 실무에서 긴 꼬리와 긴 꼬리를 잘 들여보다는 것이 중요함
- 나심 탈레브(Nassim Taleb): 주식시장의 붕괴와 같은 이례적인 사건이, 정규분포에 에측하는 것보다 더 자주 일어날 수 있다고 하는 흑고니 이론(black swan theory)를 제안
- 주가 수익률은 데이터의 긴 꼬리 특성을 설명하기 위한 좋은 예
- 넷플릭스(NFLX)의 일일 주식 수익률의 QQ 그림
- 낮은 값의 점들은 대각선보다 훨씬 낮고 높은 값은 선보다 훨씬 위에 있다.
- 데이터가 정규분포를 따른다고 할 때 예상되는 것보다 훨씬 더 많은 극단값을 관찰할 가능성이 있음을 의미
- 평균에서 표준편차 안에 있는 점들든 선 가까이에 있다.