[ 국가기술자격 빅데이터분석기사 ] 빅데이터와 베이즈 정리

베이즈 정리

베이즈 정리(Bayes Theorem) 개요

빅데이터, AI 등의 적극적 활용과 함께 베이지안 정리(Baye’s Theorem)가 새롭게 주목받고 있습니다. 지금까지의 통계분석은 대부분 빈도주의 관점에서 반복적으로 선택된 표본이 어떤 사건의 원소가 될 경향, 즉 사건의 확률을 산출하는데 초점을 맞추어 왔습니다. 그러나 이는 어떤 가설의 신뢰도를 제시하지 못할 뿐만 아니라 새로운 정보를 반영하여 확률을 조정하는 것에도 매우 미흡하여 실제적 해결책을 찾는데 커다란 제약을 가지고 있습니다. 베이지안 정리는 이런 문제점을 극복하고 실제적인 문제해결책을 찾는데 초점을 맞춥니다.

베이지안 정리는 ‘조건부 확률’이라고도 하는데 다음과 같은 특장점을 가지고 있습니다.

 

  • 확률을 상황에 따라 변할 수 있는 것이라고 생각한다. 이는 기존의 개념과 다른 것으로 추가되는 새로운 증거에 따라 확률을 새로 계산 및 개선한다.
  • ‘이전의 경험과 현재의 증거를 토대로 어떤 사건의 확률을 추론한다’. 즉, 사전 정보를 바탕으로 어떤 사건이 일어날 확률을 토대로 의사결정을 할 때 활용된다.
  • 다시 말해, 우리의 관심이 되는 확률을 알기 어려울 때 알고 있는 것을 바탕으로 거꾸로 계산하여 답을 찾는다.

 

베이지안 네트워크나 추론을 손쉽게 활용하여 보다 나은 의사결정/정책결정을 하고 성과를 높일 수 있도록 지원하는 소프트웨어, Bayesian Doctor를 한글화하여 출시하게 되었습니다. 누구나 쉽게 Bayesian Network와 Bayesian Inference를 활용할 수 있기를 기대합니다.

베이지안 이론을 활용한 확률 추론과 진단

Thomas Bayes는 확률이 상황에 따라 변할 수 있는 것이라고 생각했습니다. 이는 기존의 개념과 다른 것으로 추가되는 새로운 증거에 따라 확률을 새로 계산 및 개선합니다.

‘이전의 경험과 현재의 증거를 토대로 어떤 사건의 확률을 추론하는 알고리즘이다’.

즉, 사전 정보를 바탕으로 어떤 사건이 일어날 확률을 토대로 의사결정을 할 때 활용됩니다.

미리 알고 있는 사전확률(prior probability), 즉 A가 발생할 확률 P(A)가 있을 때, A 조건에서 B가 발생할 확률 P(B|A), 즉 우도(likelihood probability)를 활용하여 사후확률 P(A|B)를 구합니다. 사건 B를 관측한 후에 그 원인이 되는 A의 확률을 새로 산출한다는 의미로 사후확률(posterior probability)라고 합니다.
*사전확률 P(A)가 밝혀지지 않은 경우 이를 확인하는데 활용할 수도 있음

다시 말해, 우리의 관심이 되는 확률을 알기 어려울 때 알고 있는 것을 바탕으로 거꾸로 계산하여 답을 찾습니다.

경축! 아무것도 안하여 에스천사게임즈가 새로운 모습으로 재오픈 하였습니다.
어린이용이며, 설치가 필요없는 브라우저 게임입니다.
https://s1004games.com

이를 통해 어떤 대상에 대해서 가지고 있던 초기의 믿음을 객관적이고 새로운 정보로 업데이트할 때 개선된 새로운 믿음을 확보할 수 있습니다. (황승식, ‘불멸의 이론’ 설명 중)

베이즈 정리의 핵심

 

A가 발생할 확률을 P(A)라 하고, A가 발생한 조건에서 B가 발생할 확률을 P(B|A)라고 표현하면, P(B|A) = P(B∩A)/P(A)가 됩니다.

그림으로 표시하면 이해가 쉽습니다. 아래 그림에서 P(B∩A)는 (우선 전체 C에서 A가 발생해야 하므로) ‘A의 발생 확률인 P(A)’에 ‘A가 발생한 상태에서 B가 발생할 확률인 P(B|A)’를 곱하면 됩니다. 즉 P(B∩A) = P(B|A)*P(A)가 됩니다. 이항하면 P(B|A) = P(B∩A)/P(A)가 됩니다.

베이즈정리

또한 P(A|B) = P(A∩B)/P(B)이므로, P(A∩B) = P(A|B)*P(B)가 됩니다. 그리고 P(B∩A) = P(A∩B)이므로, P(B|A)*P(A) = P(A|B)*P(B)이가 되어 결국 P(B|A) = P(A|B)*P(B)/P(A)이 됩니다.
[참고] 여기서 P(A) = P(A|B)*P(B) + P(A|-B)*P(-B)로 바꾸어 쓸 수 있습니다.

즉 우리가 알고자 하는 P(B|A)를 이미 알고 있는 P(A)와 P(B), 그리고 우도 P(A|B)를 활용하여 구하였습니다.

베이즈 정리(Bayes Theorem) 활용 사례

[출처] http://expertchoice.co.kr/bayes_theorem.html

 

본 웹사이트는 광고를 포함하고 있습니다.
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.
번호 제목 글쓴이 날짜 조회 수
공지 오라클 기본 샘플 데이터베이스 졸리운_곰 2014.01.02 25085
공지 [SQL컨셉] 서적 "SQL컨셉"의 샘플 데이타 베이스 SAMPLE DATABASE of ORACLE 가을의 곰을... 2013.02.10 24564
공지 [G_SQL] Sample Database 가을의 곰을... 2012.05.20 25943
1005 [국가기술자격 빅데이터분석기사] 빅데이터 분석기사 정보 및 필기 시험 후기 분석 (기출 문제 정리) file 졸리운_곰 2022.09.21 57
1004 [국가기술자격 빅데이터분석기사] `빅데이터분석기사` 자격증의 허상 졸리운_곰 2022.09.21 40
1003 [국가기술자격 빅데이터분석기사] 빅데이터 분석기사 요약 - 4과목. 빅데이터 결과 해석 졸리운_곰 2022.09.19 29
1002 [국가기술자격 빅데이터분석기사]빅데이터 분석기사 요약 - 3과목. 빅데이터 모델링 file 졸리운_곰 2022.09.19 41
1001 [국가기술자격 빅데이터분석기사]빅데이터 분석기사 요약 - 2과목. 빅데이터 탐색 file 졸리운_곰 2022.09.19 24
1000 [국가기술자격 빅데이터분석기사]빅데이터 분석기사 요약 - 1과목. 빅데이터 분석 기획 졸리운_곰 2022.09.19 50
999 [국가기술자격 빅데이터분석기사] [빅데이터분석기사 필기 요약] I.빅데이터 분석 기획 - 02. 데이터 분석 계획 file 졸리운_곰 2022.09.15 40
998 [국가기술자격 빅데이터분석기사][빅데이터분석기사 필기 요약] I.빅데이터 분석 기획 - 01. 빅데이터의 이해 (3) 졸리운_곰 2022.09.15 10
997 [국가기술자격 빅데이터분석기사][빅데이터분석기사 필기 요약] I.빅데이터 분석 기획 - 01. 빅데이터의 이해 (2) file 졸리운_곰 2022.09.13 17
996 [국가기술자격 빅데이터분석기사] [빅데이터분석기사 필기 요약] I.빅데이터 분석 기획 - 01. 빅데이터의 이해 (1) 졸리운_곰 2022.09.13 29
995 [국가기술자격 빅데이터분석기사] [인공지능] 베이즈 정리 ( Bayes' theorem ) file 졸리운_곰 2022.09.04 21
» [ 국가기술자격 빅데이터분석기사 ] 빅데이터와 베이즈 정리 file 졸리운_곰 2022.09.04 42
993 [tensorflow] [인공지능] TensorFlow GPU 동작 확인 방법 file 졸리운_곰 2022.09.04 51
992 [국가기술자격 빅데이터분석기사] 빅데이터분석기사 - 필기 정리1 file 졸리운_곰 2022.09.01 119
991 [국가기술자격 빅데이터분석기사] 빅데이터분석기사 노트정리 공유 file 졸리운_곰 2022.09.01 171
990 [국가기술자격 빅데이터분석기사] 빅데이터 분석기사 : 개요 및 특징 file 졸리운_곰 2022.09.01 60
989 [국가기술자격 빅데이터분석기사] 빅데이터 분석 기사 개요 file 졸리운_곰 2022.09.01 24
988 [tensorflow] TensorFlow 2.x 에서 1.x 코드 사용하기 졸리운_곰 2022.08.07 67
987 [tensorflow] 텐서플로 - TF 1.*버전 vs 2.*버전 file 졸리운_곰 2022.08.07 56
986 [Mysql] mysql에서 json 다루기 file 졸리운_곰 2022.08.02 52
대표 김성준 주소 : 경기 용인 분당수지 U타워 등록번호 : 142-07-27414
통신판매업 신고 : 제2012-용인수지-0185호 출판업 신고 : 수지구청 제 123호 개인정보보호최고책임자 : 김성준 sjkim70@stechstar.com
대표전화 : 010-4589-2193 [fax] 02-6280-1294 COPYRIGHT(C) stechstar.com ALL RIGHTS RESERVED