이항 분포

  • 시행(trial): 동전 던지기와 같이 독립된 결과를 가져오는 하나의 사건
  • 성공(success): 동전 던지기에서 앞면을 기대하는 것처럼 시행에서 관심의 결과로 주로 \(1\)로 표기하며, 반대로 관심의 결과가 아닐 때 \(0\)으로 표기
  • 이항식(binomial) 또는 이진(binary): 예/아니오 또는 \(0\)/\(1\)과 같이 두 개의 값을 갖는 것
  • 이항시행(binomial trial) 또는 베르누이 시행(Bernoulli trial): 두 개의 결과가 나오는 시행
  • 이항분포(binomial distribution) 또는 베르누이 분포(Bernoulli distribution): \(x\)번 시행에서 성공한 횟수에 대한 분포
    • 각 시행마다 그 성공 확률(\(p\))이 정해져 있을 때, 주어진 시행 횟수(\(n\)) 중에서 성공한 횟수(\(x\))의 도수분포를 의미
    • \(x\)와 \(n\), 그리고 \(p\)의 값에 따라 다양한 이항분포가 존재
    • 한 번의 클릭이 판매로 이어질 확률이 \(0.02\)일 때, \(200\)번 클릭으로 매출이 \(0\)일 확률은 얼마인가?


  • 이항식의 결론은 구매/구매하지 않음, 클릭/클릭하지 않음, 생존/사망 등과 같은 의사결정 과정에서 매우 중요
  • 이항분포를 이해할 때 핵심은 일련의 시행이라는 아이디어
  • 각 시행은 정해진 확률로 두 가지 결과를 가짐
    • 동전 던지기 10번 → 앞면 또는 뒷면의 두 가지 가능한 결과를 갖는 시행을 10번하는 이항실험
    • 두 가지 결과가 50대 50의 확률을 가질 필요는 없으며, 확률이 합이 \(1\)이 되면 된다.

  • 이항분포의 평균: \(n\times p\)
    • 성공 확률이 \(p\)인 경우 \(n\)번의 시행에서 예상되는 성공 횟수
  • 이항분포의 분산: \(n\times p(1-p)\)
    • 시행 횟수가 충분할 경우, 특히 \(p\approx 0.5\)일 때 이항분포는 사실상 정규분포와 구별하기 어려움
    • 표본크기가 커질 수록 이항확률을 구하기 위해 많은 계산이 필요해 대부분의 통계 과정에서 평균과 분산으로 근사화한 정규분포를 사용


'탐색적 데이터 분석 (Exploratory Data Analysis)' 카테고리의 다른 글

푸아송 분포  (0) 2019.09.17
t-분포  (0) 2019.09.17
긴 꼬리 분포  (0) 2019.09.17
정규분포  (0) 2019.09.17
신뢰구간  (0) 2019.09.17

+ Recent posts