VP코리아
 
   
 

Content on this page requires a newer version of Adobe Flash Player.

Get Adobe Flash player

 
 
 
 
 
 
Home > 새소식 > 새소식
 


베이즈 정리와 사전/사후 확률
vp-korea  2017-02-14 15:17:20, 조회 : 299
- Download #1 : 04.jpg (32.2 KB), Download : 0


암 판정은 확률상 오진의 가능성이 높다고 합니다. 건강검진 결과 암 의심 판정을 받았을 때, 진짜로 암에 걸렸을 확률은 얼마나 될까요? 예를 들어, 성인 여성이 유방암에 걸릴 확률이 1%이고 검사 정확도가 90%라고 한다면 건강검진 결과 암 의심 판정을 받았을 때, 실제로 유방암에 걸렸을 확률은 몇 % 일까요? 대부분의 사람들은 90%라고 생각하겠지만, 여기에는 모두가 놓치기 쉬운 확률인 ‘유방암에 걸리지 않았음에도 불구하고 유방암이라고 오진할 가능성’이 포함됩니다.
  여기서 적용되는 확률의 법칙이 베이즈 정리입니다.

베이즈 정리란, 확률변수의 조건부 확률분포와 주변부 확률분포를 연관 짓는 확률이론으로 두 확률 사이의 존재하는 관계를 설명하는 것으로 조건부 확률이라고도 합니다.

이는 P(A|B) = P(A⋂B) / P(B) = P(A)*P(B|A) / P(B)의 수식으로 나타낼 수 있습니다. P(A|B)는 사건 B가 발생할 때 A의 조건부 확률로써, 사후확률이라 하는데, 이는 P(A|B)가 사건 B에 대한 구체적인 정보에 의존하기 때문입니다.
위에 든 예를 수식에 적용시켜 보도록 하겠습니다.
P(A) : 유방암에 걸릴 확률 = 0.01 (1%)
P(B) : 유방암 진단에서 양성이 나올 확률
= 유방암에 걸려 양성반응이 나올 경우 + 유방암에 걸리지 않았지만 양성 반응이 나올 경우
= P(A)*P(B|A) + P(~A)*P(B|~A) = 0.01*0.9 + 0.99*0.1 = 0.108 (10.8%)
P(B|A) : 유방암 진단이 나올 확률 = 0.9 (90%)
P(B|~A) : 유방암에 걸리지 않았지만 유방암 진단이 나올 확률 = 0.1 (10%)
∴ P(A|B) : 유방암에 걸려 유방암 진단이 나올 확률 = 0.01*0.9 / 0.108 = 0.083333 (약 8.3%)

단순히 생각했던 것과 달리, 베이즈 정리를 적용하니 성인 여성이 유방암을 진단 받았을 때, 실제로 유방암에 걸렸을 확률은 약 8.3%밖에 되지 않음을 알 수 있었습니다. 이는 유방암에 걸릴 확률 자체가 매우 낮고 오진율이 비교적 높기 때문입니다. 이러한 기법을 활용하여 미국의 유명 통계학자는 2008년 미국 대선에서 50개 주 중 49곳의 대선 결과를 예측했고, 총선에서도 상원 당선자 35명이 누구일 지를 정확히 예측했다고 합니다.

통계는 이렇듯 우리가 흔히 접할 수 있는 일상적인 상황에서도 많이 사용되고 있습니다. 저희 브이피코리아㈜ 에서는 기초적인 분석은 물론 여러 가지 통계 알고리즘을 바탕으로 다양한 NEOTIDE® 솔루션을 제공하여 최적의 의사결정을 할 수 있도록 지원하고 있으니, 많은 관심 부탁 드립니다.