스튜던트 \(t\)-분포
- \(t\)-분포: 정규분포와 모양이 비슷하지만 꼬리 부분이 약간 더 두껍고 길다
- 표본통계량의 분포를 설명하는 데 광범위하게 사용됨
- 표본평균의 분포는 일반적으로 \(t\)-분포와 같은 모양으로 표본 크기에 따라 다른 계열의 \(t\)-분포가 있다.
- 표본이 많아질 수록 더 정규분포를 닯은 \(t\)-분포가 형성된다.
탄생 배경
- \(1908\)년 윌리암 고셋(William Sealy Gosset)이 'student'라는 필명으로 논문을 발표
- '더 큰 모집단에서 추출한 표본평균의 표본분포는 무엇인가?'라는 질문에 답을 찾고자 재표본 실험을 실시
- 3,000건의 범죄자들의 키와 왼손 중지 길이 데이터에서 무작위로 4개의 표본을 추출
- \(x\)축에 표준화된 결과(\(z\) 점수)를 \(y\)축에 빈도를 나타내는 도표를 작성
- 이를 기반으로 \(t\)-분포로 알려진 함수를 유도해 표본 결과에 가장 적합한 함수를 구하고 그림으로 비교하였다
\(t\)-분포의 신뢰구간
- 표준화된 여러 통계 자료를 \(t\)-분포와 비교하여 신뢰구간을 추정할 수 있다.
- 표본평균이 \(x\)이고, 크기가 \(n\)인 표본이 있다고 가정
- 표본평균 주위의 \(90\%\) 신뢰구간은 다음과 같음
- \(t_{n-1}(.05)\)은 \(n-1\) 자유도를 갖는 \(t\)-분포의 양쪽 끝에서 \(5\%\)를 잘라내는 \(t\) 통계량을 의미
\begin{eqnarray}\bar{x}\pm t_{n-1}(.05)\times\frac{s}{\sqrt{n}}\end{eqnarray}
- 표본평균, 두 표본평균 간의 차이, 회귀 매개변수, 그 외 다른 통계량들의 분포를 구할 때 \(t\)-분포를 이용