스튜던트 \(t\)-분포

  • \(t\)-분포: 정규분포와 모양이 비슷하지만 꼬리 부분이 약간 더 두껍고 길다
  • 표본통계량의 분포를 설명하는 데 광범위하게 사용됨
  • 표본평균의 분포는 일반적으로 \(t\)-분포와 같은 모양으로 표본 크기에 따라 다른 계열의 \(t\)-분포가 있다.
  • 표본이 많아질 수록 더 정규분포를 닯은 \(t\)-분포가 형성된다.

탄생 배경

  • \(1908\)년 윌리암 고셋(William Sealy Gosset)이 'student'라는 필명으로 논문을 발표
  • '더 큰 모집단에서 추출한 표본평균의 표본분포는 무엇인가?'라는 질문에 답을 찾고자 재표본 실험을 실시
    • 3,000건의 범죄자들의 키와 왼손 중지 길이 데이터에서 무작위로 4개의 표본을 추출
    • \(x\)축에 표준화된 결과(\(z\) 점수)를 \(y\)축에 빈도를 나타내는 도표를 작성
    • 이를 기반으로 \(t\)-분포로 알려진 함수를 유도해 표본 결과에 가장 적합한 함수를 구하고 그림으로 비교하였다


\(t\)-분포의 신뢰구간

  • 표준화된 여러 통계 자료를 \(t\)-분포와 비교하여 신뢰구간을 추정할 수 있다.
  • 표본평균이 \(x\)이고, 크기가 \(n\)인 표본이 있다고 가정
  • 표본평균 주위의 \(90\%\) 신뢰구간은 다음과 같음
    • \(t_{n-1}(.05)\)은 \(n-1\) 자유도를 갖는 \(t\)-분포의 양쪽 끝에서 \(5\%\)를 잘라내는 \(t\) 통계량을 의미

\begin{eqnarray}\bar{x}\pm t_{n-1}(.05)\times\frac{s}{\sqrt{n}}\end{eqnarray}

  • 표본평균, 두 표본평균 간의 차이, 회귀 매개변수, 그 외 다른 통계량들의 분포를 구할 때 \(t\)-분포를 이용


'탐색적 데이터 분석 (Exploratory Data Analysis)' 카테고리의 다른 글

푸아송 분포  (0) 2019.09.17
이항 분포  (0) 2019.09.17
긴 꼬리 분포  (0) 2019.09.17
정규분포  (0) 2019.09.17
신뢰구간  (0) 2019.09.17

+ Recent posts