A/B TEST

  • 검정(test): 일정한 규정에 따라 자격이나 조건을 검사하여 결정
  • A/B 검정: 두 종류의 처리 방법이나 제품 또는 절차 중 어느 한쪽이 다른 한쪽보다 더 낫다는 것을 입증하기 위하여 실험대상을 A와 B 두 개의 그룹으로 나누어 진행하는 실험


A/B 검정의 예

  • 종자 발아가 어디에서 더 잘되는지 알아보기 위해 두 가지 토양 처리를 검정한다.
  • 암을 더 효과적으로 억제하는 두 가지 치료법을 검정한다.
  • 두 가지 가격을 검정하여 더 많은 순이익을 산출하는 쪽을 결정한다.
  • 두 개의 인터넷 뉴스 제목을 검정하여 더 많은 클릭을 유도하는 쪽을 결정한다.
  • 두 개의 인터넷 광고를 검정하여 어느 것이 더 높은 전환율을 얻는지 판단한다.

용어 정리

  • 대상(subject) 또는 피실험자(): 처리를 적용할 개체
  • 처리(treatment): 어떤 대상에 가하는 특별한 환경이나 조건
  • 처리군 또는 처리그룹(treatment group): 특정 처리에 노출된 대상의 집합
  • 대조군 또는 대조그룹(control group): 어떤 처리도 하지 않은 대상의 집합
  • 검정통계량(test statistics): 처리 효과를 측정하기 위한 지표
  • 눈가림 검정(blind test): 특정 처리에 대한 인식이 검정에 영향을 줄 수 있으므로 대상자가 받고 있는 처리가 A인지 B인지 알지 못하도록 하는 검정 방법


  • 제대로 된 A/B 검정에는 둘 중 어느 한쪽 처리를 가할 대상이 주어진다.
  • 검정의 핵심은 대상을 어떤 특정 처리에 노출시켜야 하는데, 대상을 무작위로 어느 한쪽 처리에 노출시키는 것이다.
  • 처리에 노출된 결과의 차이는 다음과 같은 이유로 발생한다고 생각할 수 있다.
    • 각각 다른 처리의 효과
    • 어떤 대상이 어떤 처리에 노출되는지에 관한 경우의 수
      • 무작위로 노출시킨 결과, 자연스럽게 더 좋은 결과를 보이는 대상이 A나 B 한쪽에 집중된다
  • A그룹과 B그룹을 비교하는 데 사용하는 검정통계량 또는 측정지표에 주의해야 한다.


대조그룹의 필요성

  • 대조그룹이 없다면
    • 처리그룹 이외의 대상이 모두 같다는 보장을 할 수 없으며
    • 어떤 차이가 나더라도 처리(또는 우연)로 인한 결과인지 확신할 수 없다
  • 처리를 하지 않은 대조그룹은 처리그룹과 동일한 조건을 적용한다.
    • 단순히 '기준선'이나 이전 경험과 비교할 경우, 처리 이외의 다른 요소가 개입할 가능성이 있기 때문이다.
  • 웹 환경에서의 A/B 검정 시 처리 조건의 예
    • 웹 페이지의 디자인
    • 제품의 가격
    • 헤드라인의 어감 등
  • 무작위 원칙을 고수하기 위하여 여러 행동 유형과 관련된 지표를 수집할 수 있지만, 실험이 결국 A처리와 B처리 간의 결정으로 이어지는 경우에 단일 지표나 검정통계량을 사전에 정해놓아야 하며, 그렇지 않고 실험 후 검정통계량을 사용하게 되면 연구자 편향에 의해 제대로된 결과를 얻지못할 수 있다.


'Data Science with Python' 카테고리의 다른 글

기술 통계량(Descriptive Statistics)  (0) 2020.06.16
재표본 추출  (0) 2019.11.25
가설검정  (0) 2019.11.22
1. Data Science in a Big Data World  (0) 2018.04.06

+ Recent posts