본문 바로가기
Growth/통계

불멸의 이론

by Diligejy 2023. 8. 19.

 

 

 

p.5

"사실이 바뀌면 나는 내 의견을 바꿉니다. 당신은 어떻습니까?"

- 존 메이너드 케인스

 

p.8~9

겉으로만 보자면 베이즈 정리는 딱 한 줄로 적을 수 있을 만큼 단순하기 짝이 없다. 어떤 대상에 대해서 가지고 있던 초기의 믿음을 객관적이고도 새로운 정보로 어버데이트할 때 보다 개선된 새로운 믿음을 확보할 수 있다는 게 그 내용이다. 베이즈 정리의 지지자들에게 이것은 경험을 통한 학습에 대한 하나의 우아한 진술이다. 여러 세대에 걸쳐서 이 정리가 가진 내면 논리의 마법에 빠진 사람들은 종교적인 체험과도 같은 어떤 경험을 했다. 하지만 베이즈 정리를 믿지 않는 사람들에게 이것은 그저 터무니없는 '내 마음대로'의 주관적인 규칙일 뿐이었다.

 

베이즈 정리는 1740년대 영국에서, '우리 주변 세상의 증거에 기초해 과연 신의 존재에 대한 합리적인 결론을 내릴 수 있을까?'라는 뜨거운 종교적인 논쟁 속에서 탄생했다.

 

p.10

대학 강단의 이론가들이 이론을 탄탄하게 정리하던 이 시기에 베이즈 정리로 인해 미국에서는 산재보험이 시작되었으며, 1907년에는 벨 텔레폰이 파산을 면했다. 또한 군사 기밀 노출로 억울한 누명을 썼던 알프레드 드레퓌스가 프랑스의 감옥에서 구출되었다. 연합군의 포격 지점을 지정하고 독일 유보트의 이동경로와 위치를 포착하기도 했으며, 지진의 진앙이 어디인지 파악하고 또 (비록 잘못된 추정이긴 했지만) 지구의 핵은 용융 상태의 쇠로 되어 있다고 추정했다.

 

이론상으로 베이즈 정리는 금지되었다. 하지만 베이즈 정리는 거의 모든 종류의 자료를 처리할 수 있었다. 자료가 많건 적건 상관없었다. 냉전 시기에는 유실된 수소폭탄 및 미국과 러시아의 잠수함을 찾았으며, 핵발전소의 안정성을 심사하거나 우주왕복선 챌린저호의 비극을 예측하는 데에도 사용됐다. 또한 흡연이 폐암을 유발하며 높은 콜레스트롤 수치가 심장발작을 일으킨다는 사실을 입증하는 것이나 텔레비전의 인기 뉴스 프로그램에 출연한 대통령 후보들 가운데 누가 당선될지 예측하는 데에도 큰 도움을 주었다.

 

p.25

흄이 원인과 결과에 대해서 의심을 품고 나서자 베이즈는 이 문제를 수학적으로 처리할 수 있는 방법을 모색하기 시작했다. 오늘날 불확실성의 수학이라고 할 수 있는 확률 개념이 당시에 있었더라면 훌륭한 도구가 될 수 있었겟지만, 18세기 초기만 하더라도 이런 개념은 거의 존재하지 않았다. 확률을 적용할 수 있는 부분은 오로지 도박뿐이었다. 예를 들어 도박판에서 한 사람이 에이스 넉 장을 손에 넣을 가능성은 매우 중요했다. 개신교라는 이유로 프랑스에서 여러 해 동안 감옥살이를 했던 드무아브르는 '원인에서 결과로' 가는 방식을 활용해서 이미 그 문제를 해결했다. 그러나 '결과에서 원인으로' 향하는 이른바 역질문에 대한 대답은 그 누구도 가지고 있지 않았다. 역질문의 예를 들자면 이런 것이다. 도박판의 노름꾼이 세 판 연속으로 에이스 넉 장을 손에 잡는다면, 여기에는 어떤 기회(혹은 원인)가 작용한 것일까?

 

p.36

오늘날의 기준으로 보자면 이 이론은 '베이즈-프라이스 정리'라고 해야 옳다. 프라이스는 베이즈의 성과를 발견했고, 이것이 지니는 가치를 알아보았다. 그는 베이즈가 저질렀던 오류를 바로잡았고, 공식적으로 출판되게 만들었으며, 이론의 실용적인 쓰임새를 발견했다. 그러므로 이 정리의 명칭에 베이즈의 이름만 들어가는 것은 공평하지 않다. 그러나 그 명칭은 어쩔 수 없을 만큼 너무도 확실하게 굳어져버렸다.

 

비록 오랜 세월 동안 무시되긴 했지만, 여러 원인의 역확률에 대한 해법은 걸작이었다. 그는 확률을 도박사가 빈도를 측정하는 문제에서 정보에 근거한 믿음을 측정하는 문제로 바꾸어 놓았다. 도박판에서 카드 게임을 하는 사람은 상대방이 좋은 패를 들고 있기 땜누에 베팅을 주도한다고 믿을 수도 있다. 그러나 새로 판이 여러 차례 돌아가면서 그때마다 자기 견해를 수정한다. 그리고 마침내 상대의 정직성과 허풍에 대해서 보다 정확한 평가를 할 수 있게 된다.

 

p.50~51

엄청나게 많은 복잡한 자료를 처리하는 일이 또 하나의 문제로 떠오르기 시작했다. 수없이 많은 관측 자료들이 있다고 할 때, 과학자들은 자기 손안에 들어 있는 자료의 신뢰도를 어떻게 측정할 것이며, 그 가운데 어떤 것이 가장 유효한지 구체적인 수치로 평가할 수 있을까? 이와 관련해서 관측 천문학자들이 전형적으로 채택한 방법이 있었다. 어떤 특정한 현상에 대한 가장 좋은 관측값 세 개를 선정한 다음, 이 세 개의 평균을 계산해서 채택하는 방법이었다. 하지만 그것은 어림짐작과 다름없었다. 그렇게 해서 도출한 값의 타당성을 선험적으로나 이론적으로 증명하려고 했던 사람은 아무도 없었다. 수학적 오류 이론은 아직 유아기 단계에 놓여 있었다.

 

p.53

라플라스는 1773녀녀에 확률 수학과 씨름을 하면서 이것이 가지는 철학적인 의미를 생각했다. 3월 아카데미에 제출한 에세이에서 그는 무짛나 인간을 (신과 비교하지 않고) 세상의 모든 것을 다 아는 상상 속 어떤 지성과 비교했다. 인간이 모든 것을 확신을 가지고서 알 수 있기란 불가능하므로, 확률은 우리의 무지를 드러내는 수학적인 표현이었다. "인간 정신의 허약함 때문에 가장 미묘하고 천재적인 수학적 이론, 즉 기회 혹은 확률의 과학이 탄생한다."

 

p.60~61

라플라스는 그 후 10년 동안 자기 수학에 몇 가지 단점이 있다는 사실을 점점 더 분명하고 고통스럽게 인정해야 했다. 그의 이론은 각각의 최초 가설에 균등한 확률을 설정할 수밖에 없었다. 과학자로서 그는 이런 한계를 인정해야만 했다. 만일 그의 방법론이 현실을 반영하려면 의심스러운 자료를 보다 유효한 관측값과 구별할 필요가 있었다. 있을 수 있는 모든 사건 혹은 관측값이 균등한 개연성을 가진다고 말할 수 있는 경우는 오로지 이론적인 설정뿐이다. 예를 들어, 완벽한 정육면체처럼 보이는 주사위도 실제로는 조금씩 뒤틀려 있다. 처음은 각각의 카드 게임 참가자가 동일한 승리 확률을 가지고 있다는 설정으로 시작한다. 그런데 판이 거듭될수록 각자의 수준 차이가 드러나기 시작했고 이들의 승률도 바뀌었다. 이 점에 대해서 라플라스는 다음과 같이 말했다. "기회의 과학은 조심스럽게 다루어야 한다. 그리고 수학의 세계에서 실제 세상으로 넘어갈 때는 반드시 보정을 해야 한다."

 

댓글