복수의 정보를 얻었을 때의 추정
1. 복수의 정보를 바탕으로 베이즈 추정을 실시
- 지금까지 실시한 베이즈 추정은 사전 정보를 1회로 한정했다
- 그러나 실제 추정에서는 복수의 정보로부터 이루어진다
- 베이즈 추정은 복수의 정보를 얻었을 때의 추정에 관해 상당히 중요한 성질을 가진다
2. 두 종류의 실험 조합
- 직면한 현상에 대한 결과을 얻기위해서는 여러 가지 가능성이 있어 각각의 가능성에 확률을 할당할 수 있는 경우 그 현상을 '실험(experiment)'이라고 부른다
- 지금까지는 단순히 '정보'라고 해왔지만 이제부터는 '실험'이라는 용어도 사용한다
- 예를 들어, 주사위를 던져서 나온 눈을 확인한 것이 '실험'이다
- 또한 내일 날씨가 맑음, 구름, 비, 눈의 네 가지 결론 중 무엇이 될 것인가를 보는 것도 '실험'이다
- 이제 두 종류의 실험이 있을 때, 그 두 가지를 한데 묶어 그것을 또 다른 실험으로 본다면 그 결론에 대한 각각의 확률은 어떻게 될지에 대해 생각해 보자
두 종류의 실험에 대한 베이즈 확률을 구하기 위해 다음과 같은 경우를 생각해보자
- 제1실험은 동전을 던져 앞이나 뒤가 나오는 것을 결론으로 하는 확률 현상이다
- 제2실험은 주사위를 던져서 나올 눈을 결론으로 하는 확률 현상이다
- 위의 두 시행을 하나로 묶으면 제 3시행이 만들어진다
- 예를 들어, 제1시행에서 '앞면'이 나오고, 제2시행에서 '$4$'가 나온 경우 이를 하나로 묶어서 '앞면과 $4$'라는 제3시행을 얻을 수 있다
- 이와 같은 실험을 '직적 실험(direct product experiments)'라고 한다
- 제3실험의 결과는 다음과 같이 동전의 앞뒤 $2$가지와 주사위의 눈의 수 $6$가지에 대하여 $2\times 6=12$가지가 된다
- 참고로, '직적' 또는 '직접곱'이라는 수학용어는 각각의 경우를 곱하여 모든 경우의 수를 아래와 같이 격자 모양에 늘어놓아 묶음을 만드는 것을 뜻한다
3. 독립적인 직적실험의 확률은 곱셈으로 구할 수 있다
- '2개의 실험이 독립'되어 있다는 것은 '어느 한쪽의 실험이 다른 한쪽의 실험 결과에 영향을 미치지 않는다'는 것을 의미하며 '독립 실험'이라고 한다
- 예를 들어 동전과 주사위를 던지는 실험의 경우, 동전의 앞면이 나오는 결과가 주사위가 어떤 눈이 나오는지에 대해 영향을 주지 않는다
- 이 것이 '실험의 독립성'이다
- 그러면 '독립되지 않은 2개의 실험'은 무엇일까?
- 예를 들어, '서울의 내일 날씨'와 '경기도의 내일 날씨'라는 실험은 '관계가 없다'고 볼 수 없을 것이다
- 서울에서 내일 비가 온다고 하면 경기도에도 내일 비가 내릴 가능성이 상당히 높다고 추측하는 것이 일반적이다
- 이처럼 2개의 실험이 독립적이지 않은 실험을 '종속 실험'이라고 한다
- 실험의 독립성을 논할 때 '서로 영향을 주지 않는다'고 하거나 '관계가 없다'고 정의하는 것은 좋은 방법이 아니다
- 수학적으로 어떻게 정의하고 계산해야할 것인지 알 수가 없기 때문이다
- '어느 한쪽의 실험이 다른 실험에 영향을 주지 않는다'는 것과 직감적으로 동일한 것을 뜻하게 될 수학적 계산에 의해 독립성을 정의해보자
독립 실험에 대한 수학적 정의
앞에서 논의했던 동전 던지기와 주사위 던지기 실험을 생각해보자
- 주사위 던지기에서 눈이 $1$이 나올 확률은 $\frac{1}{6}$이며, 다른 눈이 나올 확률도 동일하게 $\frac{1}{6}$이다
- 이제 다시 앞의 복합 실험 결과표에서 '앞면'일 경우만을 제외하면 주사위의 각 눈이 나올 확률은 어떻게 될까?
- 만일 $1$이 나오기 쉽다면(확률이 $\frac{1}{6}$보다 크다면), '앞면'이라는 동전 던지기 실험의 결과가 주사위 던지기 실험에 영향을 준다고 생각할 수 있다
- 따라서 동전이 '앞면'이라는 결과가 주사위 던지기 실험의 결과 몇이 나오는가에 영향을 주지 않는다면 동전 던지기의 결과 '앞면'의 경우만을 빼더라도 역시 주사위 던지기의 결과는 동일하게 나올 것이다
- 이는 동전이 '뒷면'이라는 결과에 대해서도 동일하게 적용된다
- 이 단계에서는 아래 그림에서 위아래 직사각형의 면적이 같다는 사실을 알 수 없다
- 그런데 주사위의 눈이 '$6$'인 묶음을 뺐을 때 그것이 동전의 '앞'과 '뒤'에 영향을 주지 않는다는 점을 생각하면 오른쪽 끝에 있는 위아래 직사각형 2개는 면적이 같다는 것을 알 수 있다
- 따라서 위 '격자 모양으로 늘어선 직사각형 $12$개의 면적은 모두 같다'고 할 수 있다
- 그러면 각 실험(동전 던지기와 주사위 던지기를 묶은 실험)의 결과에 대한 확률을 나타내는 직사각형의 면적은 어떻게 될까요?
- 정규화 조건에서 합계가 $1$이 된다는 것을 떠올리면 각 직사각형의 면적은 $1\div 12=\frac{1}{12}$임을 알 수 있다
- 직사각형이 $12$개 인 것은 동전 던지기의 결과 $2$가지와 주사위 던지기의 결과 $6$가지를 곱했기 때문이다
- 따라서 다음과 같이 정리할 수 있다
\begin{eqnarray} \textrm{직사각형의 면적} &=& \frac{1}{12} \\ &=& \frac{1}{2} \times \frac{1}{6} \\ &=& \textrm{동전 $1$개 던지기의 결과에 대한 확률}\times\textrm{주사위 $1$개 던지기의 결과에 대한 확률}\tag{9.1}\end{eqnarray}
- 식 (9.1)을 실험의 각 묶음에 대해 구체적으로 적어보면
\begin{eqnarray} \textrm{앞과 $1$이 나올 확률} = \textrm{앞이 나올 확률} \times \textrm{$1$이 나올 확률} \end{eqnarray}
또는
\begin{eqnarray} \textrm{뒤와 $5$가 나올 확률} = \textrm{뒤가 나올 확률} \times \textrm{$5$가 나올 확률} \end{eqnarray}
과 같이 된다
- 따라서 '묶음의 확률은 각 확률의 곱이 된다'는 뜻이다
4. 독립 실험의 확류에 대한 곱셈 공식
앞의 동전 던지기와 주사위 던지기 실험의 예에서는 직사각형이 완전히 균등하게 분할되어 있는데 이것은 특수한 경우로 일반적인 경우를 생각해보자
- 예를 들어 제1실험의 결과가 $a$, $b$, $c$, $d$의 $4$가지이며, 제2실험의 결과가 $x$, $y$, $z$의 $3$가지인데 각각 일어날 확률은 같지 않을 수 있다
- 이 $2$가지 실험이 독립적인 경우, 직적 실험은 다음과 같이 그릴 수 있다
- 위의 그림에서 행 하나만을 보면 직사각형 $4$개의 면적은 제각각이며, 열 하나를 보더라도 직사각형 $3$개의 면적도 제각각이다
- 그러나 하나의 행만을 보면 $4$개의 직사각형 각 면적의 비례관계는 어느 행이나 같으며, 열 또한 각 사각형의 면적 비례관계도 동일하다
- 따라서 각 행에서 $4$개의 직사각형은 제1실험의 결과를 나타내기 때문에 직사각형의 가로 변의 비는 제1실험의 결과의 확률의 비와 같다
- 또한 각 열에서 $3$개의 직사각형은 제2실험의 결과를 나타내기 때문에 직사각형의 세로 변의 비는 제2실험의 결과의 확률의 비와 같다
- 따라서 다음과 같이 구할 수 있다
\begin{eqnarray}\textrm{$a$와 $x$일 확률} &=& \textrm{$a$일 확률} \times \textrm{$x$일 확률}\\ \textrm{$a$와 $y$일 확률} &=& \textrm{$a$일 확률} \times \textrm{$y$일 확률}\\\vdots \\ \textrm{$d$와 $z$일 확률} &=& \textrm{$d$일 확률} \times \textrm{$z$일 확률}\\\end{eqnarray}
- 위와 같은 곱셈 공식을 '독립 실험 확률의 곱셈 공식'이라고 한다
출처 : 세상에서 가장 쉬운 베이트 통계학 입문
'Bayesian Statistics' 카테고리의 다른 글
10. Bayesian Inference under Multiple Information - Spam Mail Filiter (0) | 2018.06.29 |
---|---|
08. Principle of Maximum Likelihood (0) | 2018.06.27 |
07. Bayesian Infernece의 특징 (0) | 2018.06.14 |
06. Neyman-Pearson Inference (0) | 2018.05.30 |
05. Bayesian Inference의 특징 (0) | 2018.05.30 |