가정 및 개인 생활 분야
위치 예측
- Nokia
- 노키아는 휴대폰 추적을 통해서 미래의 사용자 위치를 예측하는 콘테스트를 주최하였다. 이를 통해 얻은 방법론들은 부분적으로 사용자 친구들의 행위(예를 들면 한 사람이 통화하는 사회적 접촉 대상자들)을 분석에 포함시켜서 스위스의 특정 지역에 거주하는 사람들에 대해서 평균적으로 그들이 어디에 있게 될 것인지를 하루 전에 20미터 범위 내에서 예측할 수 있다.
- Microsoft
- GPS 데이터에 근거하여 한 사람이 몇 년 후에 어디에 있게 될 것인지를 정확하게 예측하는 기술을 개발하는데 예측 분석을 활용하였다.
우정 예측
- 당신이 알고 있을 가능성이 있는 사람들 및 연결하고 싶어할 가능성이 있는 사람들을 정확하게 추천하는 방법론을 개선하기 위한 콘테스트를 후원하였다.
- 당신이 알고 있을 가능성이 있는 사람들을 예측하여 추천하는 서비스가 '자신들이 만든 것들 중에서 가장 중요한 데이터 제품'이라고
사랑 예측
- Match.com
- 온라인 데이트에서 '지능적 소개팅(Intelligent Matching)'은 당신이 교류하고 싶어할 가능성이 높은 상대를 예측한다.
- OKCupid
- 온라인 데이트에서 어떠한 메시지가 상대방으로부터 반응을 얻을 가능성이 가장 높은지를 예측한다.
임신 예측
- Target 쇼핑몰
- 쇼핑 행태로부터 고객의 임신을 예측함으로써 30%나 더 많은 대상자를 찾아내어 신생아 부모의 구매욕구에 호소할 수 있는 할인쿠폰을 보낸다.
불륜 예측
- 모 대학 연구진
- 불륜행각은 인구사회학적 특징보다는 형태 특징에 의해서 더 정확하게 예측된다는 것을 보여주었다. 물론 유전적 요소도 영향을 준다고 하였다.
이혼 예측
- 모 병원 연구진
- 90% 정확도를 가지고 이혼을 예측한다.
사망 예측
- 보험, 의료, 범죄 소탕 및 안전 분야
마케팅, 광고, 웹 분야
(타겟 마케팅을 위하여) 구매 행위 예측
- PREMIER Bankcard
- 1,200만 달러의 우편 홍보물 비용을 절감하였다.
- First Tennessee Bank
- 우편 홍보물 비용은 20% 절감하고 반응률은 3.1% 증가하여 예측 분석에 투자된 비용 대비 600% 수익을 창출하였다.
- Target
- 예측 분석을 통해 매출액이 15~30% 증가하였다.
- Harbor Sweets
- 구매한 지 오래된 고객들을 다시 오게 만들기 위해서 데이터 분석을 통해 타깃을 선정하였는데 40%라는 놀라운 반응률을 보였다.
- Fingerhut
- 타기팅으로 우편 홍보물을 20% 줄여서 연간 거의 300만 달러를 절감하면서도 수익은 오히려 더 늘어났다.
- Vermont Country Store
- 판매 카달로그 발송 대상을 보다 정확하게 타기팅함으로써 데이터 분석에 투자한 비용 대비 11배가 넘는 수익률을 거두었다.
- Harrah's Las Vegas
- 이 카지노 업체는 각각의 고객들이 장기적으로 얼마나 지출할 것인지를 예측하였다.(이를 고객의 '평생가치'라고 부르기도 하였다.)
- Cox Communications
- 구매 경향으로 예측함으로써 우편 홍보물에 대한 반응률이 3배 증가하였다. 특히 가정용 TV, 인터넷, 이동통신 서비스 등과 같은 커뮤니케이션 관련 제품들에 대한 요구를 예측함으로써 연간 수익률이 50%에 이르게 되었다.
- 뮤추얼 펀드 투자관리 회사
- 평균적인 개인보다 추가적인 투자를 할 가능성이 5배나 더 높은 고객들을 선별해 내었다.
- 영국의 한 수퍼마켓
- 고객들 중 19%에 대해서 그 고객이 재방문할 날짜를 정확하게 예측할 수 있었으며, 그들이 지출할 금액에 대해서 10달러 이상 차이나지 않게 정확하게 예측할 수 있었다.
- Elie Tahari
- 여성 패션라인 제품에 대한 수요를 예측하였다.
(고객 유지를 위하여) 구매 취소 행위 예측
- PREMIER Bankcard
- 고객 예치금 800만 달러를 이탈하지 않고 계속 보관하게 만들었다.
- FedEx
- 어느 고객이 경쟁업체로 넘어갈 것인가를 65~90% 정확도로 예측하였다.
- 호주 Optus
- 이동통신 서비스의 평균 가입자보다 서비스 해지 가능성이 10배나 높은 고객을 선별해 내었다.
- Sprint
- 유선전화 서비스의 평균 가입자보다 서비스 해지 가능성이 3배나 높은 고객을 선별해 내었다.
- 노르웨이 Telenor
- 이동통신 서비스 가입자의 이탈률을 36% 감소시켰으며, 고객유치 비용 대비 수익은 11배 높아졌다.
- 뉴질랜드 2degrees
- 이동통신 서비스의 평균 가입자보다 서비스 해지 가능성이 12배나 높은 고객을 선별해 내었다.
- Lloyds TSB
- 고객 이탈에 대한 예측 모델링을 개선함으로써 연간 이익이 800만 파운드나 증가하였다.
- Chase Bank
- 부동산 담보대출 조기 상환 고객을 선별해 내었다.
- Reed Elsevier
- 잡지의 구독갱신률이 16% 증가하였다.
(거래 우선순위 선정을 위하여) 세일즈 성공 가능성 예측
- IBM
- IBM 캐나다 법인은 세일즈를 위해 계획한 이벤트에 응할 참가자 목표를 83% 신뢰도를 가지고 예측하였다. 즉 '우리가 이 파티를 주최한다면 사람들이 충분히 참가할 것인가?'를 예측한 것이다. 여기에는 IBM 예측 분석 솔루션의 세일즈도 포함되어 있으므로 예측 분석을 팔기 위해서 예측 분석을 한 것이다.
- HP
- 세일즈 담당자들에게 판매 기회를 예견해 주는 조기 경보 시스템을 구축하여 95%의 정확도로 세일즈 노력의 결과 중 92%를 예측하였다. 또한 전체 60%의 딜에 대해서 최종 결과까지 걸리는 시간을 예측하였다.
- Bella Pictures
- 웨딩사진 촬영 예약판매를 위해서 예비신부를 타겟팅하였다.
- PayChex
- 급여 및 인력관리 서비스 제공업체인 이 회사는 영업 목적의 전화통화 중 성공 가능성이 적은 통화를 예측 선별함으로써 전체 영업 목적의 통화수를 40% 감소시킴과 동시에 전체 세일즈를 늘릴 수 있었다.
- Sun Microsystems
- 전화 영업 성공률은 2배나 향상시켰다.
(개인 맞춤화된 추천을 위하여) 제품 선택 예측
- Amazon.com
- 제품 추천을 통한 매출이 전체 매출의 35%를 차지한다.
- Netflix
- 영화 추천 능력 개선을 위한 100만 달러 상금의 콘테스트를 주최하였다. 넷플릭스 가입자들이 선택하는 영화 중 약 70%는 온라인 추천에 의한 것이라고 한다.
- 영국 Tesco
- 13개국에 걸친 마트 계산대에서 연간 1억 장의 개인맞춤화된 쿠폰을 발급한다. 예측 모델링은 그 이전의 다른 방법론들과 비교할 때 쿠폰 사용률을 3.6배나 증가시켰다.
- Target
- 제품 선별 추천 모델을 사용한 타기팅 우편홍보물로 매출이 15~20% 증가하였다.
- U.S. Bank
- 반응률이 2배 향상되었으며 투자 대비 교차판매 수익률이 5배 증가하였다.
- Pandora
- 400가지의 음악적 특성에 근거하여 음악을 추천한다.
(보여줄 콘텐츠를 선별하기 위하여) 마우스 클릭 예측
- Google
- 사용자에게 검색 결과로 보여질 웹페이지들 중 어떤 것이 사용자의 고품질 요구에 더 부합하는가를 예측함으로써 검색 기능을 향상시켰다.
- 교육 관련 한 포털
- 사용자가 클릭할 가능성이 더 높은 고아고를 보여줌으로써 매 19개월마다 100만 달러의 매출을 추가로 창출하였다.
(광고주에게 경고하기 위하여) 비효율적인 광고 예측
- 새로운 광고들 중에서 어떤 것이 더 많이 후회(bounce)하게 만드는가를 예측한다(즉, 사람들이 어떤 광고를 클릭한 후 즉시 이전 페이지로 다시 되돌아오는가를 분석한다).
(노출 극대화를 위하여) 트윗 및 게시물의 구전 효과 예측
- MTV
- 비디오 뮤직 어워드 방송 시 해당 웹피이지의 페이지 뷰가 55% 증가하였다.
(스팸 편지함에 자동으로 집어넣기 위하여) 스팸 메일 예측
- Google
- 2004년까지만 해도 상당히 높았던 Gmail의 스팸 메일 오인률(false positive rate)이 현재는 거의 무시해도 좋을 정도로 낮아졌다.
히트곡 및 히트 영화
- 모 연구진
- 머신 러닝을 이용해 어떤 시나리오 대본이 할리우드의 대박 영화가 될 것인지 그리고 어떤 노래가 음원 차트에서 히트를 칠 것인지를 예측하였다.
금융 리스크 및 보험 분야
자동차 충돌로 인한 신체 상해 예측
- Allstate
- 2012년에 개최된 예측 모델링 콘테스트를 통해서 보험 가입 차량의 특성들에 근거하여 신체 상해 부담금액의 예측 정확도를 3배나 향상시켰다.
고액의 산업재해 상해 예측
- Accident Fund Insurance
- 의료보허 가입자의 비용청구서 내용으로부터 2차적 건강 조건(예를 들면 비만이나 당뇨병 여부)을 확인한다. 이러한 조건들은 어떤 상해를 당했을 때 고액의 비용이 발생할지를 예측하게 해줌으로써 예를 들어 보험에 가입한 직원들 중 특정인에게 예방조치를 취하도록 할 것인지 여부를 판단할 수 있게 해준다.
보험 청구 예측
- Infinity Insurance
- 보험 청구 신청서 승인 및 거절에 활용
- 유명한 국제상선보험사
- 예측 모델을 이용하여 '손실률'을 0.5% 낮춤으로써 거의 5천만 달러를 절약할 수 있게 되었다.
사망 예측
- 생명보함사들
- 보험가입 승인 여부 및 보함납입액을 결정하기 위해서 사망 연령을 예측한다.
- 상위 5위권에 드는 미국의 한 의료보험회사
- 사망 예측은 의료보험의 일반적 영역에 포함되지 않는다. 이 사례의 본질은 의료 분야 참조
부동산 담보대출 조기상환 예측
- Chase Bank
- 어떤 주택소유자가 부동산 담보대출을 갈아타기(대환대출)하여 향후 지불할 이자를 모조리 경쟁 은행에 가져다줄지를 미리 알 수 있는 예측 모델을 사용하여 수억 달러의 이익을 창출하였다.
파산(리스크) 예측
- Citigroup
- 30년이 넘는 기간 동안의 국제적 채무불이행 사례들에 대한 분석을 활용하여 각 지역별로(북미 및 서유럽 지역에서는 더 세분하여 산업별로) 상업적 신용 리스크 모델들을 개발하였다. 은행 내부에서 이러한 모델을 이용한 담당자들이 3천 명에 이르며 이 모델들은 20년이 넘게 이용되었다.
- Canadian Tire
- 리스크 관리를 위해서 신용카드 지불 연체를 예측하였다.
- PREMIER Bankcard
- 연체율 및 대손상각비율을 낮출 수 있었으며 1천만 달러 이상의 수익을 올렸다.
청구서 체납 예측
- Brasil Telecom(지금은 Oi로 개명)
- 악성 체납을 예측하여 400만 달러를 회수하였다.
- DTE Energy
- 대손상각에 대해서 선제적으로 대응하고 서비스 해지를 줄임으로써 비용을 700% 절감하였다.
- 모 금융기관
- 전액 상환이 불가능하다고 채무자들에게 상환금액을 조정해 주고 전액 상환이 가능하다고 예측된 채무자들에게는 조정을 해주지 않음으로써 210만 달러 규모의 손실을 줄일 수 있었다.
주식시장(블랙박스 거래) 예측
- London Stock Exchange
- 런전 주식거래소 거래량의 약 40%가 알고리즘 시스템에 의해서 이루어진다.
- John Elder
- 자신이 직접 설계한 블랙박스 거래 시스템에 자신의 전재산을 투자하였다.
- 다양한 회사들
- AlphaGenius, Cerebellum Captial, Rebellion Research, 그리고 많은 회사들이 알고리즘에 의해서 거래한다.
의료 분야
사망 예측
- 상위 5위권에 드는 미국의 한 의료보험회사
- 말기 의료 서비스(유언장 작성 및 통증완화 치료 등)를 제공하기 위하여 건강보험 노인 가입자가 18개월 이내에 사망할 가능성을 예측한다.
- Riskprediction.org.uk
- 사용자의 신체조건 등에 근거하여 간단한 수술, 중대한 수술, 복잡한 수술, 복원성 대장직장절제술 같은 특수수술 등의 수술 도중에 사망할 리스크를 예측한다.
유행성 독감 예측
- Google Flu Trends
- (증상과 관련된) 온라인 검색 트렌드를 분석함으로써 질병통제센터보다 7~10일 앞서서 병원의 독감 환자 증가를 예측할 수 있다는 것을 보여주었다.
유방암 탐지
- Stanford Univeristy
- 예측 모델링을 활용하여 샘플 세포조직의 더 많은 요소들을 고려함으로써 유방암을 의사보다 훨씬 더 잘 진단해 낼 수 있는 혁신적 방법론을 개발하였다.
패혈증 예측
- Systers of Mercy Health Systems
- 환자의 활력징후(vital signs) 관찰에 근거하여 심각한 패혈증 및 패혈 쇼크를 예측한다. 수용 가능한 오인율 범위 내에서 71%의 케이스를 탐지하였다.
HIV 진행 예측
- 모 연구진
- 질병 진행에 대한 예측 정확도를 70%에서 78%로 개선하였다.
약품 효능 예측
- Pfizer
- 환자에게 약품 투여 시 3주 이내에 호전될 확률을 예측한다.
조산 예측
- 브리검영 대학 및 유타 대학
- 빠르면 임신 24주차의 혈액 샘플에서 찾아볼 수 있는 펩타이드 바이오마커(peptide biomarker)에 근거하여 조산 위험성을 80% 정도 정확하게 예측한다.
발기 부전 예측
- Pfizer
- 더 효과적이고 간단한 자가진단 테스트용 5가지를 개발하였다.
- John Elder
- 자신이 직접 설계한 블랙박스 거래 시스템에 자신의 전재산을 투자하였다.
- 다양한 회사들
- AlphaGenius, Cerebellum Captial, Rebellion Research, 그리고 많은 회사들이 알고리즘에 의해서 거래한다.
출처 : 빅데이터의 다음 단계는 예측 분석이다 - 에릭 시겔
'Predictive Analytics' 카테고리의 다른 글
최소제곱법 (0) | 2019.09.24 |
---|---|
단순선형회귀 (0) | 2019.09.19 |
Predictive Analytics (0) | 2018.04.16 |
Python 준비 (0) | 2017.03.31 |
Linear Regression Analysis with Python #2 (0) | 2017.03.31 |