들어가기: 데이터를 넘어선 생각
성공한 과학분야는 기호를 기반으로 발전했다. - 아우구스투스 드 모르간 (1864)
이 책에서는 새로운 과학분야에 관한 이야기를 하려고 한다. 이 분야에서는 사실과 픽션을 구분하는 과학적 방법을 발견했고, 또 활발히 적용하고 있지만, 일반 대중에게는 이 분야가 아직 알려지지 않았다. 우리 삶 전반에 이미 큰 영향을 주고 있으며, 신약개발에서부터 경제정책, 교육분야와 로봇공학에서부터 총기규제와 기후변화에 이르기까지 다양한 분야에 미치는 영향은 앞으로도 계속 커질 것이다. 통합프레임워크 아래에서 다양하고, 독보적 영역의 문제 모두를 설명할 수 있게 되었는데, 이 프레임워크는 20년 전까지는 실질적으로 존재하지도 않았다.
이 새로운 학문은 아직 근사한 이름이 없다. 나는 내 동료들과 함께 “인과추론(causal inference)”이라고 부른다. 특별한 고급기술도 아니다. 인과추론이 모방하려는 이상적 기술은 바로 우리 머리 속에 있다. 수만 년 전, 인류는 어떤 것이 다른 것을 야기하고, 전자를 손보면 후자를 바꿀 수 있다는 것을 인지하기 시작했다. 인류 외에 어떤 종도 이 능력을 획득하지 못했다. 이게 아니라면, 최소한, 인류가 하는 수준의 능력을 가진 종은 없다. 이 발견으로 인해 조직화된 사회가 생겨났고, 마을과 도시가 생겨나고, 최종적으로 오늘날 우리가 누리고 있는 과학기술 기반 문명이 나타났다. 이 모든 것이 다음의 짧은 질문때문이다. 왜(why)?
인과추론은 이 질문을 진지하게 다루는 분야이다. 인과추론에서는 인간 두뇌는 원인과 결과를 다루려고 고안된 가장 발전된 도구라고 가정한다. 우리 시대에 중요한 문제들을 해결하기 위해 뇌는 데이터를 영양분으로 엄청난 양의 인과지식을 저장하고 활용한다. 좀 더 야심차게 표현하면, 우리가 인과사고 내부의 논리를 잘 이해하기만 하면, 컴퓨터로 재현해서 “인공과학자”를 창조할 수 있을 것이다. 이렇게 만들어 진 똑똑한 로봇은 미지의 현상을 발견하고, 미해결 문제를 과학적으로 설명하고, 실험을 새롭게 설계하고, 환경에서 인과지식을 지속적으로 추출할 것이다.
미래모습을 상상하기에 앞서, 인과추론이 지금까지 이룬 성과를 살펴보는 것이 중요하다. 데이터를 다루는 분야에서 인과추론이 과학자들의 생각을 어떻게 전환시켰는지와, 앞으로 우리 삶이 어떻게 바뀔 것인지를 살펴볼 것이다.
이 새로운 과학분야에서 다루는 문제들은 다음과 같이 명확한 것들이다.
- 특정 처방이 질병 예방에 얼마나 효과적인가?
- 새로운 세금제도가 우리 매출 증가를 야기했는가? 아니면 우리 광고 캠페인 때문인가?
- 비만에 때문에 발생하는 헬스케어 비용은 무엇인가?
- 한 직원의 채용기록이 성차별 정책을 어겼는지 증명가능한가?
- 직장을 그만두려고 한다. 그렇게 해야하나?
이러한 문제들은 모두 “원인과 결과”의 관계를 다룬다는 공통점이 있다. “예방”, “야기하다”, “때문에 발생하는”, “정책”, “해야하나”와 같은 단어를 통해 알 수 있다. 이러한 단어들은 일상에서 많이 쓰고, 우리 사회에서는 이러한 질문을 끊임없이 한다. 하지만, 최근까지 과학은 이러한 질문에 대한 답은 차치하고서라도, 설명할 수단조차 줄 수 없었다.
인과추론이 인류에 가장 크게 기여한 것은, 이렇게 과학적으로 소홀히 한 것을 마감했다는 것이다. 우리가 알고 있는 인과관계와, 또 밝히고 싶은 인과관계를 설명하기 위해 간단한 수학언어가 만들어졌다. 인과관계를 수학적 형태로 표현하는 능력이 생기자, 우리 지식을 데이터와 결합하여, 위의 다섯 질문들과 같은 인과질문에 답할 수 있는 강력하고도 일관된 방법들이 촉발되었다.
나는 운이 좋게도 과거 25년동안 이 분야의 발전에 참여할 수 있었다. 나는 학생들의 책상과 연구실에서 그 진전이 구체화되는 것을 지켜보았고, 대중의 관심과는 거리가 먼 암울한 학술회의에서 이 혁신이 공명하는 것을 들었다. 우리는 강한 인공지능(AI)의 시대에 들어왔고, 많은 사람들이 빅데이터와 딥러닝의 무한한 가능성을 노래하고 있다. 이러한 시대에, 새로운 과학분야가 가고 있는 가장 모험적인 길에 대해, 그리고, 이 길이 데이터과학에 얼마나 큰 영향을 주고 있는지, 또 21세기 우리 삶이 얼마나 다양한 방식으로 바뀔 것인지에 대해 독자들에게 제시하는 일은 시의적절하기도 하고 흥분되는 일이다.
내가 앞에서 “새로운 과학분야”에 대해 말했을 때, 쉽게 납득이 되지 않은 독자들도 있었을 것이다. 왜 훨씬 전에 이루어지지 않았지? 라고 생각하면서 말이다. 버질Virgil은 “원인에 대해 이해할 수 있었던 자는 운이 좋다”(기원전 29년)라고 말했을 때는 어떤가. 아니면 현대 통계학의 아버지인 프란시스 골턴Francis Galton과 칼 피어슨Karl Pearson이 모집단 데이터가 과학적 질문들에 답을 제공해 줄 수 있다는 것을 처음 발견했을 때는 어떤가. 당시 인과관계를 받아들이지 못한 내막 이야기가 길게 있는데, 역사를 다루는 부분에서 볼 것이다. 그러나 내 생각에 가장 큰 걸림돌은 인과적 질문을 던지는 어휘와 과학적 이론을 전달하는 전통적 어휘가 서로 근본적으로 다르다는 데에 있었다.
이 차이의 깊이를 가늠해 보자. 과학자가 명백한 인과관계를 표현하려고 할 때 어떠한 어려움에 직면할지 상상해 보자. 예를 들어 기압계 눈금 \(B\) 가 대기압 \(P\) 에 해당한다고 하자. 이 관계를 다음과 같은 방정식으로 쉽게 쓸 수 있다. \(B = kP\), 여기서 \(k\) 는 비례 상수이다. 대수학의 규칙을 사용하여 동일한 방정식을 \(P = B/k\), \(k = B/P\), \(B–kP = 0\) 과 같이 다양한 형태로 다시 쓸 수 있다. 이 방정식들은 모두 같은 의미이다. 세 가지 값 중 두 개만 알면 세 번째 값이 결정된다. \(k\), \(B\), \(P\) 문자 중 어느 것도 다른 문자보다 수학적으로 우월하지 않다. 그렇다면 압력 때문에 기압계가 변한 것이지, 반대 방향이 아니라는 강한 확신을 어떻게 표현할 수 있을까? 그리고 이것조차 표현할 수 없다면, 수학 공식이 없는 인과관계에서의 확신, 예를 들면, 닭울음소리가 해를 뜨게 하지 않는다와 같은 확신은 어떻게 표현할 수 있겠는가?
나의 대학교수님에게는 이를 표현할 수단이 없었고, 또 이를 불편해 하지도 않았다. 여러분들의 교수님들도 같았을 것이다. 이유는 다음과 같다. 교수님들은 인과를 위한 수학적 언어를 몰랐고, 이를 사용했을 때의 혜택도 알지 못했다. 그러한 언어를 개발하는 것을 여러 세대에 걸쳐 소홀히 한 것은 사실 과학의 고발대상이라 할 수 있다. 스위치를 켜면 조명이 켜지거나 꺼지고, 무더운 여름 오후에 동네 아이스크림 가게의 매출이 증가한다는 것은 누구나 알고 있다. 그렇다면 과학자들은 이러한 명백한 사실을 왜 공식으로 표현하지 못했을까? 광학, 역학, 기하학의 기본 법칙에서와 같이 말이다. 그들은 왜 과학의 다른 분야가 번성하고 성숙할 수 있었던 수학적 도구를 박탈하여, 이러한 사실들이 직관에만 갖혀있도록 했는가?
정답의 일부는, 과학적 도구가 과학적 요구를 충족시키기 위해 개발되었기 때문이다. 더 정확히 표현하자면, 스위치, 아이스크림, 기압계에 대한 질문은 우리가 잘 처리할 수 있기 때문에, 특별한 수학적 기계가 딱히 필요하지는 않았다. 그러나 과학적 호기심이 증가하고 복잡한 법적, 비즈니스, 의료 및 정책 결정 상황에서 인과질문을 제기하기 시작하면서 성숙한 과학분야라면 있었을 도구와 원칙이 부족하다는 것을 알게 되었다.
이렇게 뒤늦게 깨닫게 된 것은 과학사에서 드문 일이 아니다. 예를 들어, 약 400년 전까지만 해도 사람들은 본능만을 이용해서 길을 건너고, 주먹다짐을 하는 등 일상 생활에서의 불확실성을 그럭저럭 다룰 수 있었다. 도박꾼들이 복잡한 확률게임을 발명하고, 때로는 우리를 속여 잘못된 선택을 하도록 정교하게 고안하자, 블레이즈 파스칼Blaise Pascal(1654), 피에르 드 페르마Pierre de Fermat(1654), 크리스티안 히긴스Christiaan Huygens(1657)와 같은 수학자들이 오늘날의 확률론을 개발할 필요가 있음을 알게 되었다. 마찬가지로, 보험기관이 정확한 수명 추정값을 요구한 후에야 에드몬드 할리Edmond Halley(1693), 아브라함 드 무아브르Abraham de Moivre(1725)와 같은 수학자들은 기대수명을 계산하기 위해 사망률 표를 보기 시작했다. 천문학자들이 천체운동에 대해 정확한 예측을 요구하고 나서야, 제이콥 베르누이Jacob Bernoulli, 피에르-시몬 라플라스Pierre-Simon Laplace, 칼 프리드릭 가우스Carl Friedrich Gauss가 오류이론을 개발하여, 잡음에서 신호를 추출하는 데 도움을 주었다. 이 방법들은 모두 오늘날 통계학의 전신이었다.
아이러니하게도 인과관계 이론의 필요성이 대두되기 시작한 건 통계학이 등장하면서였다. 골턴과 피어슨이 유전에 대해 인과적 질문을 하였고, 세대간 데이터를 사용하여 독창적으로 답하려고 시도하면서 현대통계학이 태어나게 된 것이다. 그러나 불행하게도 이 시도는 실패로 끝났다. “왜?”에 대해 시간을 쓰는 대신, 이러한 질문을 제한적으로 선언했다. 통계학이라고 불리는 분야를 인과관계를 빼고 개발하는 데 집중했다.
과학사에서 결정적인 순간이었다. 인과관계 문제에 자신만의 언어를 가지게 될 기회가 실현될 뻔했다. 다음 몇 년 동안 이러한 질문은 비과학적인 것으로 간주되어 수면 아래로 내려갔다. 유전학자 시월 라이트Sewall Wright(1889-1988)의 영웅적인 노력에도 불구하고 인과관계 어휘는 반세기가 넘는 기간 동안 사실상 금지되었다. 말이 금지되면, 생각, 원칙, 방법, 도구도 함께 금기시된다.
독자는 과학자가 아니어도 이 금기를 볼 수 있다. 기초통계학 수업에서 모든 학생은 “상관관계는 인과관계가 아니다” 라고 외치는 법을 배운다. 정당한 이유와 함께! 수탉의 울음소리는 일출과 강한 상관관계가 있지만 일출을 야기하지 않는다.
통계학은 이러한 상식적인 관찰에 대해 결론을 성급하게 내렸다. 상관관계가 인과관계가 아니라고 하지만 인과관계가 무엇인지는 알려주지 않는다. 통계학 교과서 색인 부분에서 “원인” 항목을 찾아봐도 없을 것이다. 학생들은 \(X\)가 \(Y\)의 원인이라고 하면 안되고, \(X\) 와 \(Y\) 가 “관련” 또는 “연관”되었다고만 말해야 한다1.
이러한 금기 때문에 인과관계 질문을 관리하는 수학적 도구가 필요없다고 여겨졌고, 통계학은 데이터를 해석하는 방법이 아니라 데이터를 요약하는 방법에만 집중했다. 주옥과 같은 예외가 있었는데, 1920년대 유전학자 시월 라이트가 발명한 경로분석path analysis으로, 이는 우리가 이 책에서 다룰 방법론의 직계 조상이다. 그러나 경로분석은 통계학 및 유관 집단에서 심각하게 과소평가되었으며, 수십 년 동안 초기 상태에서 시들어 있었다. 1980년대까지 인과추론을 향한 첫 번째 단계여야 했던 것이 유일한 단계였다. 통계학을 지침으로 삼았던 많은 학문을 포함한 통계학 나머지 분야는 모든 과학적 질문에 대한 답이 데이터에 있다고 잘못 믿고 “금지의 시대”에 남아 있다가, 영리한 데이터마이닝 트릭을 통해 공개되었다.
이러한 데이터 중심적 역사의 대부분은 오늘날에도 여전히 우리를 괴롭히고 있다. 우리는 빅데이터가 모든 문제의 해결책이라고 가정하는 시대에 살고 있다. 대학마다 “데이터과학” 과정이 개설되고 있으며 “데이터 경제”에 참여하는 회사에서 “데이터 과학자” 직업이 잘 나간다. 그러나 여러분들은 이 책을 통해 데이터가 완전히 멍청하다는 것을 확신하기를 바란다. 데이터는 약을 복용한 사람들이 복용하지 않은 사람들보다 빨리 나았음을 알려줄 수 있지만 그 이유는 말할 수 없다. 아마도 약을 복용한 사람들은 약을 살 여유가 있어서 복용한 것이고, 약이 없었더라도 빨리 회복했을 수도 있다.
과학계와 산업계에서 데이터만으로는 충분하지 않은 상황이 있다. 빅데이터 추종자 대부분들은 이러한 한계를 어느 정도 인식하면서도 여전히 금지의 시대에 있는 것처럼 “데이터 중심 지능”을 계속 추구한다.
앞서 언급했듯이 지난 30년 동안 상황이 극적으로 바뀌었다. 오늘날, 신중하게 만들어진 인과모델 덕분에 현대 과학자들은 해결할 수 없거나 과학적 탐구의 범위를 넘어서는 것으로 생각되던 문제를 해결할 수 있게 되었다. 예를 들어, 불과 100년 전만 해도 흡연이 건강에 해를 끼치는지에 대한 질문은 비과학적인 것으로 여겨졌다. 저명한 통계 저널에서 “원인” 또는 “결과”라는 단어를 언급하는 것만으로도 반발이 폭풍처럼 몰려왔을 것이다.
20년 전만 해도 통계학에서 “제 두통을 멈추게 한 것은 아스피린이었나?”와 같은 질문은 부두교를 믿는지 묻는 것과 같았을 것이다. 존경하는 동료의 말을 빌리자면 이것은 “과학적 탐구라기보다 칵테일 대화 주제”에 가깝다고 여겨졌을 것이다. 그러나 오늘날 전염병학자, 사회과학자, 컴퓨터과학자, 그리고 적어도 일부 계몽된 경제학자와 통계학자는 일상적으로 그러한 질문을 제기하고 수학적으로 정확하게 답한다. 나에게 이 변화는 혁명이나 다름없다. 나는 감히 “인과혁명”이라고 부르고 싶다. 원인과 결과를 이해하는 우리의 타고난 인지적 재능을 부정하지 않고 끌어안는 “과학 대개혁”이다.
인과혁명이 아무 것도 없는 곳에서 일어난 것은 아니다. 비밀스러운 수학이 아래에 있다. 이 수학은 인과관계 계산법이라고 표현할 수 있는데, 이를 이용하여 매우 어려운 인과관계 문제에 대답할 수 있다. 이 수학을 공개하는 것이 가슴벅찬 이유는 역사가 격동적으로 발전한 것이 흥미롭기 때문일 뿐만 아니라, 언젠가는 내가 상상할 수 있는 것 이상으로 … 아마도 이 책의 독자에 의해서도 그 잠재력이 완전히 개발될 것이라고 기대하기 때문이다.
인과관계의 수학은 두가지 언어로 구성된다. 우리가 이미 아는 것을 표현하는 데에 사용하는 인과다이아그램, 그리고 우리가 알고 싶은 것을 표현하는 데에 사용하는, 대수와 유사한 상징적 언어가 바로 그것이다. 인과다이아그램은 우리의 기존 과학적 지식을 요약한 단순한 점과 화살표 그림이다. 점은 “변수”라고 하는 관심있는 값을 나타내고 화살표는 해당 변수 사이의 알려진 또는 의심되는 인과관계, 즉 어떤 변수가 다른 변수를 “듣는지(listen to)”를 나타낸다. 이 다이어그램은 그리고, 이해하고, 사용하기가 매우 쉽다. 이 책에서 수십 개의 다이어그램을 보게 될 것이다. 일방통행 도로 지도를 읽을 수 있다면 인과관계 다이어그램을 이해할 수 있고 앞 부분에서 제기된 유형의 질문들을 해결할 수 있다.
나는 지난 35년의 연구기간동안, 그리고 이 책에서, 인과다이아그램을 도구로 선택했지만, 인과다이아그램이 유일한 인과관계 모델은 아니다. 수학방정식을 좋아하는 과학자들도 있다 (예: 계량경제학자). 다른 사람들(예: 하드코어 통계학자)은 다이아그램의 구조를 표면적으로 요약하는 가정목록을 선호한다. 언어와 상관없이 모델은 데이터를 생성하는 프로세스, 즉 환경에서 작동하고 생성된 데이터를 형성하는 인과관계를 정성적으로 묘사해야 한다.
이 다이아그램으로 표현된 “지식의 언어”와 함께, 우리가 답을 원하는 질문을 표현하는 상징적인 “질문의 언어”도 있다. 예를 들어, 약물(\(D\))이 수명(\(L\))에 미치는 영향에 관심이 있는 경우 질의는 수학기호로 \(P(L|do(D))\) 와 같이 표현할 수 있다. 수직선은 “주어진 것”을 의미하므로 다음과 같이 질문한다. 일반 환자가 약물을 복용하게 된 경우(\(do(D)\)) \(L\) 년 생존할 확률(\(P\))은 얼마인가? 이 질문은 역학자가 개입(intervention) 또는 처치(treatment) 라고 부르는 것이 무엇인지를 설명하는데, 임상실험에서 측정하는 것이 바로 이것이다. \(P(L|do(D))\) 를 \(P(L|do(not-D)\)) 와 비교하고 싶은 경우도 많다. 후자를 “대조군” 환자라고 하는데, 치료가 거부된 환자를 나타낸다. do-연산자do-operator는 수동적 관찰이 아니라 개입을 다루고 있음을 의미한다. 고전적 통계에는 이와 비슷한 것이 없다.
개입 연산자 \(do(D)\) 를 사용해야, 수명 \(L\) 에서의 관측된 변화가 약물 자체에 인한 것이고, 수명을 단축하거나 연장하는 경향이 있는 다른 요인과 교락confound된 것이 아니라고 보장할 수 있다. 개입하는 대신 환자 자신이 약물 복용 여부를 결정하도록 하면, 다른 요인이 환자의 결정에 영향을 미칠 수 있고, 약물 복용과 복용하지 않는 것의 수명 차이가 더이상 전적으로 약물 때문이 아니게 된다. 예를 들어, 말기 환자들만이 약을 복용했다고 가정해 보라. 그러한 사람들은 약을 복용하지 않은 사람들과 확실히 다를 것이고, 두 그룹의 비교는 약물의 효과보다는 질병의 중증도의 차이를 반영할 것이다. 반대로, 전제 조건에 관계없이 환자에게 약물을 복용하거나 복용을 자제하도록 강요하는 것은 기존의 차이점을 없애고 유효한 비교를 제공할 것이다.
수학적으로 표현하면, 자발적으로 약을 복용한 환자 중 관찰된 수명 \(L\) 의 빈도를 통계교과서에서 사용하는 표준 조건부 확률인 \(P(L|D)\) 로 쓴다. 이 표현식은 환자가 약물 \(D\) 를 복용하는 것을 보는 조건 하에 수명 \(L\) 의 확률(\(P\))을 나타낸다. \(P(L|D)\) 는 \(P(L|do(D))\) 와 완전히 다를 수 있다. 보는 것과 행동하는 것의 이러한 차이는 근본적이다. 우리가 기압계 눈금이 낮아지는 것을 폭풍의 원인으로 간주하지 않는 이유이기도 하다. 기압계가 눈금이 낮아지는 것을 보면 폭풍의 확률이 증가하지만 강제로 낮게 만들면, 폭풍확률에 영향이 없다.
보는 것과 행동하는 것 사이의 이러한 혼란은 역설의 샘으로 작용했다. 일부를 이 책에서 다룰 것이다. \(P(L|do(D))\) 가 없고 오로지 \(P(L|D)\) 에 의해 지배되는 세계는 참으로 이상한 세계일 것이다. 예를 들어, 환자는 중병에 걸릴 확률을 줄이기 위해 의사에게 가는 것을 피한다. 도시는 화재 발생을 줄이기 위해 소방관을 해고할 것이다. 의사는 남성과 여성 환자에게 약물을 권장하지만 성별이 밝혀지지 않은 환자에게는 권장하지 않는다 등등. 30년도 채 되지 않아 과학이 그러한 세계에서 작동했다는 것이 믿기 어렵다.
인과혁명의 가장 큰 업적 중 하나는 실제로 개입을 하지 않고 개입의 효과를 예측하는 방법을 설명하는 것이다. 우리가 먼저 올바른 질문을 할 수 있도록 do-연산자를 정의하고, 두 번째로 이를 모방하는 비침습적 방법을 고안하지 않았다면 불가능했을 것이다.
연구 중인 과학적 질문 안에 회고적 사고가 포함되어 있다면, 우리는 반사실counterfactual이라고 하는 인과추론과 다른 유형의 표현이 필요하게 된다. 예를 들어 조라는 환자가 \(D\) 를 복용하고 한 달 후에 사망했다고 가정해 보자. 우리가 관심을 갖는 질문은 약물이 그의 죽음을 초래했는지 여부이다. 이 질문에 답하기 위해 우리는 환자가 약을 복용하려고 했지만 마음이 바뀌는 시나리오를 상상할 필요가 있다. 그는 살았을까? 다시 말하지만, 고전 통계는 데이터를 요약할 뿐이므로 앞에서 본 질문에 대해서는 언어조차 제공하지 않는다. 인과추론은 표기법을 제공하고 더 중요하게는 해법을 제공한다. 개입의 효과를 예측하는 것과 마찬가지로(위에서 언급함), 많은 경우에 우리는, 관찰된 세계에 대해 알고 있는 것을 취하여 반사실적 세계에 대한 답을 산출하는 알고리즘을 사용하여 인간의 회고적 사고를 모방할 수 있다. 이 “반사실의 알고리즘화”는 인과혁명에 의해 밝혀진 또 다른 정수이다.
가정what-if을 다루는 반사실적 추론은 일부 독자에게 비과학적으로 보일 수 있다. 실제로 경험적 관찰은 그러한 질문에 대한 답을 절대로 확인하거나 반박할 수 없다. 그러나 우리의 마음은, 현재 있을 수 있는 것, 과거에 있었을 수도 있는 것에 대해 신뢰할 수 있고 재현 가능한 판단을 항상 내린다. 예를 들어, 우리 모두는 오늘 아침 수탉이 울지 않았어도 해가 떴을 것이라는 것을 알고 있다. 우리가 이에 합의를 이루는 것은 반사실이 기발한 산물이 아니라 우리 세계 모델의 구조를 반영한다는 사실 때문이다. 만약 두 사람이 동일한 인과모델을 공유한다면, 모든 반사실적 판단도 공유한다.
반사실은 과학적 사고 뿐만 아니라 도덕적 행동을 이루는 레고조각이다. 자신의 과거 행동을 반성하고 대안적인 시나리오를 구상하는 능력은 자유의지와 사회적 책임의 기초를 이룬다. 반사실의 알고리즘화는 생각하는 기계가 이 능력의 이점을 누리고 세계에 대한 인간 고유의 사고방식(지금까지)에 참여하도록 초대한다.
이전 단락에서 생각하는 기계에 대해 이야기를 한 것은 특별히 의도한 것이다. 나는 인공지능 분야에서 일하는 컴퓨터과학자로서 이 주제에 이르렀다. 인공지능 분야는 인과추론 분야의 나의 동료 대부분과 두 가지 점에서 다르다. 첫째, AI의 세계에서는 당신은 기계 로봇에게 가르칠 수 있어야 주제를 제대로 이해하는 것이다. 이것이 내가 표기법, 언어, 어휘 및 문법을 강조하고 다시 강조하는 이유이다. 예를 들어, 나는 우리가 주어진 언어로 특정 주장을 표현할 수 있는지 여부와 한 주장이 다른 주장에 뒤따르는지 여부에 집착한다. 놀랍게도, 과학적 발화의 문법을 따르는 것만으로도 매우 많은 것을 배울 수 있다. 나는 언어가 우리의 생각을 형성한다고 믿기 때문에 언어에 대해 강조한다. 질문할 수 없는 질문에는 대답할 수 없고, 사용할 수 있는 언어가 없는 질문은 할 수 없다. 철학과 컴퓨터과학을 공부하고 있었던 나는 근본이 없는 과학언어가 태어날 때부터 성숙할 때까지 만들어지는 것을 보고, 인과추론에 대해 매력을 갖게 되었다.
기계학습에 대한 배경지식은 인과관계 연구에 또 다른 동기가 되었다. 1980년대 후반에 나는 기계가 인과관계에 대한 이해가 부족한 것이, 인간 수준의 지능을 제공하는 데 가장 큰 장애물이 될 것임을 깨달았다. 이 책의 마지막 장에서는 나의 근원으로 돌아가서 인공지능에 대한 인과혁명의 함의를 함께 탐구할 것이다. 나는 강력한 AI가 달성 가능한 목표이며 인과관계가 해답의 일부이기 때문에 두려워하지 말아야 할 목표라고 믿는다. 인과추론 모듈은 기계가 자신의 실수를 반성하고, 소프트웨어의 약점을 정확히 지적하고, 도덕적 실체로 기능하고, 인간과 선택과 의도에 대해 자연스럽게 대화할 수 있는 능력을 제공한다.
현실 청사진
현시대의 독자들은 “지식”, “정보”, “지능”, “데이터”와 같은 용어를 틀림없이 들어봤을 것이다. 이들이 어떻게 서로 다른지, 어떻게 상호작용하는지에 대해 혼란스러운 독자들도 있을 것이다. 여기에 나는 “인과모델” 용어까지 추가해야한다고 이야기하고 있다. 여러분들이 더 혼란스러워질 것이라고 우려하는 것도 당연하다.
걱정할 필요가 없다! 과학, 지식, 데이터, 이 세가지 애매한 개념이 구체적이고 유의미하게 고정되고, 함께 작동하여 어떻게 어려운 과학적 질문에 대한 답변을 생성하는지를 볼 수 있게 된다. 그림I.1은 미래 인공지능에 대한 인과적 추론을 처리할 수 있는 “인과관계 추론엔진”의 청사진을 보여준다. 미래에 대한 청사진일 뿐만 아니라 오늘날 과학 응용 분야에서 인과모델이 작동하는 방식과 데이터와 상호작용하는 방식에 대한 가이드이다.

추론엔진은 가정(Assumption), 질의(Query), 데이터(Data)라는 세 유형을 입력으로 취하고, 또 세 가지 유형을 출력하는 기계이다. 첫 번째 출력은, 데이터가 완전하고 무제한이라고 가정할 때, 주어진 질의가 이론상 기존 인과모델에 따라 답변될 수 있는지 여부에 대한 예/아니오 답변이다. 대답이 예이면 추론엔진이 estimand 를 생성한다. estimand 는 사용 가능한 모든 가상 데이터에서 답을 생성하는 레시피로 생각할 수 있는 수학공식이다. 마지막으로 추론엔진은 데이터 입력을 수신한 후 레시피를 사용하여 답변에 대한 실제 추정값estimate을 생성한다. 해당 estimand 의 불확실성 정도도 함께 생성한다. 데이터셋의 제한된 크기와 가능한 측정오류 또는 누락된 데이터를 반영하는 것이다.
차트를 자세히 설명하기 위해, 박스에 1 에서 9 까지 번호를 매겼다. “약물 \(D\) 의 수명 \(L\) 에의 효과는 무엇인가?” 라는 질문을 예로 살펴보자.
“지식”은 추론에이전트가 과거에 경험한 궤적을 의미한다. 관심있는 질문과 관련된 과거 관측값들, 과거 행동들, 교육, 문화적 관습을 포함한다. “지식” 주위의 점선 상자는 지식이 에이전트의 마음에 암묵적으로 남아 있고 모델에서 공식적으로 설명되지 않음을 나타낸다.
과학연구는 항상 가정(Assumption)을 단순화해야 한다. 가정은 연구자가 사용 가능한 지식을 기반으로 명시할 가치가 있다고 생각하는 명제이다. 연구자의 지식 대부분은 뇌에 암묵적으로 남아 있지만, 이 중 가정만 빛을 보고 모델에 캡슐화된다. 실제로 가정은 모델에서 읽을 수 있으며, 모델이 가정 목록에 불과하다는 결론을 내리는 논리학자들도 있다. 컴퓨터과학자들은 이 주장에 이의를 제기한다. 가정 표현 방식에 따라 가정을 정확하게 지정하고, 결론을 도출하고, 설득력 있는 증거에 비추어 가정을 확장하거나 수정하는 능력에 중대하게 차이가 나기 때문이다.
인과모델로 다양한 선택지가 있다. 인과다이아그램, 구조방정식, 논리 명제 등을 인과모델로 선택할 수 있다. 나는 거의 모든 응용에 있어, 인과다이어그램에 흠뻑 빠져들었다. 주된 이유는 투명성 때문이었는데, 이외에도, 관심있는 다양한 질문에 대한 답변이 명확하다는 이유도 있었다. 다이어그램을 구성하기 위해 “인과관계”의 정의는 비유적이긴 하지만 간단하다. \(Y\) 가 \(X\) 를 “듣고(listen to)”, 듣는 것에 대한 응답으로 값을 결정하는 경우, 변수 \(X\) 는 \(Y\) 의 원인이다. 예를 들어, 환자의 수명 \(L\) 이 약물 \(D\) 복용 여부를 “듣는” 것으로 의심되는 경우 \(D\) 를 \(L\) 의 원인이라고 부르고 인과관계 다이어그램에서 \(D\) 에서 \(L\) 로 화살표를 그린다. 당연히 \(D\) 와 \(L\) 에 대한 질문의 답은 다른 변수에도 의존할 가능성이 높으며, 이는 원인, 결과와 함께 다이어그램에도 표시되어야 한다. (여기에서는 \(Z\) 로 일괄 표기한다.)
인과모델의 경로가 규정하는 듣는패턴으로 인해, 데이터에서 관측 가능한 패턴 또는 종속성이 나타난다. 이러한 패턴은 모델을 테스트하는 데 사용할 수 있기 때문에, “테스트 가능한 해석(testable implications)”이라고 한다. “\(D\) 와 \(L\) 을 연결하는 경로가 없다.”와 같은 명제이다. 다음과 같은 통계적 명제로 번역할 수 있다. “\(D\) 와 \(L\) 은 독립적이다.” 즉, \(D\) 의 값이 \(L\) 의 가능도(likelihood)를 변경하지 않는다. 데이터가 이 해석과 모순되면, 모델을 수정해야 한다. 박스 4와 7에서 입력을 가져와 “적합도(degree of fitness)”, 즉 데이터가 모델의 가정에 들어맞는 정도를 계산하는 다른 엔진이 필요하다. 그림I.1에서는 이 두번째 엔진을 생략했다.
추론엔진에 제출된 질의는 관심있는 과학적 질문이다. 이 질의들은 인과 어휘로 공식화되어야 한다. 예를 들어 \(P(L|do(D))\) 은? 인과혁명의 주요 업적은 이 언어를 수학적으로 엄밀할 뿐만 아니라 과학적으로 투명하게 만든 것이다.
라틴어에서 온 “estimand” 는 “추정되는 것”이라는 의미이다. 이는 추정할 통계적 정량값인데, 추정한다면 우리 질의의 정답을 합법적으로 표현할 수 있다. estimand 는 예를 들어 \(P(L | D, Z) \times P(Z)\) 와 같이 확률공식으로 작성되지만, 실제로는 엔진이 인증하면, 가지고 있는 데이터 유형으로부터 인과 질의에 답하는 레시피이다.
데이터양의 크기에 상관없이 현재 인과관계 모델 하에서는 답할 수 없는 질의가 있을 수 있는데, 이는 통계학에서 전통적인 추정과는 다른 점이다. 예를 들어 모델에서 \(D\) 와 \(L\) 이 모두 세 번째 변수 \(Z\)(예: 질병의 단계)에 의존하는데, \(Z\) 를 측정할 방법이 없는 경우 질의 \(P(L|do(D))\) 에 답할 수 없다. 이 경우 데이터를 수집하는 것은 시간 낭비이다. 대신 \(Z\) 를 추정할 수 있는 새로운 과학적 지식을 추가하거나, (틀릴 위험을 감수하고) 가정을 단순화하여 (예: \(D\)에 대한 \(Z\)의 영향은 무시할 수 있음), 처음으로 돌아가서, 모델을 수정해야 한다.데이터는 estimand 레시피에 들어가는 재료이다. 데이터는 인과관계에 대해 완전히 멍청하다는 사실을 깨닫는 것이 중요하다. 데이터는 \(P(L|D)\) 또는 \(P(L|D, Z)\) 와 같은 수량에 대해 알려준다. 이러한 통계적 양을 모델 가정에 기반하여 인과관계 질의와 논리적으로 동일한 하나의 표현식, 예를 들면, \(P(L|do(D))\)으로 요리하는 방법을 알려주는 것이 estimand 가 하는 일이다.
전통적인 통계분석에는 estimand 의 개념, 그리고 그림I.1의 전체 상단 부분은 존재하지 않는다. 기존에는 estimand 와 질의가 일치한다. 예를 들어 수명이 \(L\)인 사람들 중 약 \(D\)를 복용한 사람의 비율에 관심이 있는 경우 이 질의를 \(P(D|L)\)로 작성한다. 이것이 우리의 estimand 일 것이다. 이것은 추정해야 하는 데이터의 비율을 이미 지정하기 때문에, 인과관계에 관한 지식이 필요하지 않다. 이러한 이유로 일부 통계학자들은 통계 영역을 벗어난 지식이 있고, 데이터만으로는 과학적 지식의 부족을 보충할 수 없다는 것을 이해하는데 오늘날까지도 어려움을 겪고 있다.추정값은 기계적으로 산출되는 것이다. 그러나 데이터에 대한 다음의 또 다른 사실 때문에 이는 근사값일 뿐이다. 데이터는 항상 이론적으로 무한한 모집단의 유한한 표본일 뿐이다. 현재 예시에서 샘플은 우리가 연구하기로 선택한 환자로 구성된다. 무작위로 선택하더라도 표본에서 측정된 비율이 전체 모집단의 비율을 대표하지 않을 가능성은 항상 존재한다. 다행히도 오늘날 통계분야가 기계학습이라는 고급기술로 강화되었기 때문에, 이러한 불확실성을 관리하는 방법이 아주 많아졌다. 모수적, 준모수적 모델, 최대가능도방법, 성향점수propensity score는 희소데이터를 평활화하는 데 자주 사용된다.
마지막으로, 우리 모델이 정확하고 데이터가 충분하다면 인과적 질문에 대해 “약물 \(D\) 는 당뇨병 환자 \(Z\) 의 수명 \(L\) 을 30 \(\pm\) 20 % 증가시킨다.” 와 같은 답변을 얻게 된다. 만세! 새로 얻은 답은 또한 우리의 과학적 지식에 추가될 것이며 (박스 1) 일이 예상한 대로 진행되지 않았다면 인과모델에 대한 몇 가지 개선 사항을 제안할 것이다 (박스 3).
이 순서도는 처음에는 복잡해 보일 수 있다. 실제로 필요한 것인지 의문을 가질 수도 있다. 실제로 우리는 일상 생활에서 의식적으로 복잡한 과정을 거치지 않고도, 또 당연히 확률과 비율의 수학에 의존하지 않고도, 인과적 판단을 할 수 있다. 인과 직관만 가지고도 일상생활이나 심지어 직장생활에서도 불확실성을 충분히 처리할 수 있다. 그러나 멍청한 로봇에게 인과적으로 생각하도록 가르치거나 우리를 안내할 직관이 없는 과학 지식의 한계를 뛰어 넘고 싶다면, 이와 같이 신중하게 구조화된 절차가 필요하다.
나는 위의 과정에서 데이터의 역할에 특별히 주목하고 싶다. 첫째, 데이터를 수집하는 것이, 인과모델을 가정한 이후, 우리가 답하고자 하는 과학적 질문을 진술한 후, 그리고 estimand 를 도출한 후 라는 점에 주목하라. 이는 위에서 언급한 인과관계 모델조차 없는 기존의 통계적 접근 방식과 대비된다.
그러나 오늘날 과학계에는 원인과 결과의 건전한 추론에 대해 새로운 문제가 나타났다. 인과모델의 필요성에 대한 인식이 과학계에서 비약적으로 성장한 반면, 인공지능의 많은 연구자들은 인과모델을 구성하거나 획득하는 어려운 단계를 건너뛰고, 모든 인지작업에 대해 데이터에만 의존하고 싶어한다. 이들이 암묵적으로 희망하는 바는 인과관계에 대한 질문이 제기될 때마다 데이터 자체가 우리를 올바른 답변으로 안내할 것이라는 것이다.
데이터가 원인과 결과에 관해 얼마나 어리석은지 알고 있기 때문에 나는 이 추세에 대해 회의론자라고 밝히고 있다. 예를 들어, 행동이나 개입의 효과에 대한 정보는 통제된 실험 조작에 의해 수집되지 않는 한 원시 데이터에서 얻을 수 없다. 대조적으로, 우리에게 인과모델이 있다면 손 대지않은, 개입하지 않은 데이터에서 개입의 결과를 예측할 수 있다.
“우리가 다르게 행동했다면 어떻게 되었을까?”와 같은 반사실적 질문에 답하려고 할 때 인과모델의 장점이 훨씬 더 부각된다. 반사실은 인공지능에서 가장 어려운 질문이기 때문에 우리는 이에 대해 꽤 깊이 논의할 것이다. 반사실은 또한 우리를 인간으로 만든 인지적 발전과 과학을 가능하게 한 핵심 인지능력이다. 또한 원인이 결과로 전달되는 메커니즘에 대한 모든 질문(가장 전형적인 “왜?” 질문)이 실제는 반사실 질문이라는 것을 살펴볼 것이다. 따라서 로봇이 “왜?” 질문에 대답하게 만들거나, 질문을 이해하게라도 하려면, 그림I.1에서와 같이 인과모델을 제공하고 반사실적 질문에 답하는 방법을 가르쳐야 한다.
데이터마이닝과 딥러닝에게는 없는 인과모델의 또 다른 장점은 적응력(adaptability)이다. 그림I.1에서 estimand 는 데이터의 세부 사항을 조사하기 전에 인과관계 모델만을 기반으로 계산되었다. 그렇기 때문에 인과추론엔진의 적응력이 매우 좋게 된다. 계산된 estimand 는 정성적 모델과 호환되는 모든 데이터에 (변수간 수치적 관계에 관계없이) 유효하기 때문이다.
적응력이 왜 중요한지 알아보기 위해, 이 엔진을 데이터에서만 학습하려고 하는 학습에이전트(이 경우 인간이지만 다른 경우에는 딥러닝 알고리즘 또는 딥러닝 알고리즘을 사용하는 인간)와 비교해 보자. 약물 \(D\) 가 제공된 많은 환자의 결과 \(L\) 을 관찰함으로써 학습에이전트는 특성 \(Z\) 를 가진 환자가 \(L\) 년 생존할 확률을 예측할 수 있다. 이제 학습에이전트는 인구 특성(식이 요법, 위생, 작업 습관)이 다른 도시의 다른 지역에 있는 다른 병원으로 이송된다. 이러한 새로운 특성이 단순히 기록된 변수 간의 수치적 관계를 수정하더라도 학습에이전트는 여전히 자신을 재교육하고 새로운 예측함수를 다시 학습해야한다. 딥러닝 프로그램이 할 수 있는 일은 데이터에 함수를 맞추는 것이다.
반면에 학습에이전트가 약물작동 방법에 관한 모델을 가지고 있고 새로운 위치에서 그 인과구조가 그대로 남아 있다면, 훈련에서 얻은 추정값은 유효할 것이다. 새로운 데이터에 적용하여 모집단별 예측함수를 새롭게 생성할 수 있다.
“인과추론 렌즈를 통하면” 많은 과학적 질문들이 다르게 보인다. 이 렌즈는 지난 25년 동안 새로운 통찰력과 새로운 도구에 의해 강화되고 있다. 나는 이 렌즈를 즐겁게 사용하고 있다. 이 책을 읽는 독자들도 나의 기쁨을 함께 나누기를 희망하고, 믿는다. 그러므로 이 책에서 앞으로 나올 몇 가지 매력을 미리 보는 것으로 들어가기 장을 마치려 한다.
1장에서는 인과사다리 비유를 사용하여 관측, 개입, 반사실 세 단계의 관계를 표현한다. 주요 모델링 도구인 인과다이아그램을 이용한 추론의 기초를 살펴보고, 유창한 인과추론자가 되는 길로 안내할 것이다. 사실 여러분은 인과사다리를 이용하지 못하고 데이터를 모델-블라인드 렌즈로 해석하려고 했던 데이터 과학자보다 몇 세기 앞서게 될 것이다.
2장에서는 통계학이 인과관계에 있어 스스로 눈을 멀게 되었고, 이것이 데이터를 다루는 모든 과학분야에 광범위한 영향을 주었던 것에 대한 기이한 이야기를 들려준다. 또한 이 책의 위대한 영웅인 유전학자 시월 라이트에 대해 이야기한다. 그는 1920년대에 인과다이아그램을 처음으로 사용했고, 인과관계를 용기있고 진지하게 받아들인 몇 안 되는 과학자 중 한 명이었다.
3장에서는 내가 AI, 특히 베이지언 네트워크 연구를 통해 어떻게 인과성 연구로 전향했는지에 관한 흥미로운 이야기를 들려준다. 베이지언 네트워크는 컴퓨터가 “회색으로shades of gray” 생각할 수 있게 만든 첫번째 도구였다. 나는 베이지언 네트워크가 AI를 열어줄 열쇠를 쥐고 있다고 한동안 믿었었다. 1980년대 말로 가면서, 내가 틀렸다는 것을 확신하게 되었다. 예언가에서 변절자가 된 개인적인 여정을 이야기한다. 그럼에도 불구하고 베이지언 네트워크는 여전히 AI 의 중요한 도구이고, 인과다이아그램의 수학적 기초의 많은 부분을 요약한다. 베이즈 법칙과 베이즈 추론방법에 대해 인과성 관점에서 쉽게 소개하고, 베이지언 네트워크의 실생활 적용 예를 살펴볼 것이다.
4장에서는 인과추론에의 통계학의 주된 기여에 대해 이야기한다. 바로 랜덤화 통제 실험(RCT)이다. 인과 관점에서, RCT는 자연의 성질인, \(P(L|do(D))\) 질의를 밝히는 인간이 만든 도구이다. 주된 목적은 관심있는 변수들(말하자면, \(D\) 와 \(L\))을, 다른 변수(\(Z\))와 연관성을 제거하는 것인데, 그렇게 하지 않으면 둘에 영향을 줄 것이다. 이러한 잠재 변수가 만든 왜곡, 즉 “교락”을 제거하는 것은 세기동안 지속된 문제였다. 이 장은 일반적인 교락 문제의 놀랍게 간단한 해법으로 독자들을 인도하는데, 다이아그램에서 경로를 추적하는 게임을 10분 정도 하면 이해할 수 있을 것이다.
5장에서는 흡연이 폐암을 야기하는지에 관한 문제로 통계학자들이 씨름했던 인과의 역사, 그리고 과학의 역사에 중요한 순간을 설명한다. 통계학자들이 제일 좋아하는 도구인, 랜덤화 통제실험을 사용할 수 없어서, 답에 대하여, 혹은 문제를 이해하는 방법에조차 합의하느라 애를 썼다. 흡연 논쟁으로 인해 인과성의 중요성이 매우 부각된다. 과학자들에게 인과 질문을 대답할 적절한 언어나 방법이 없었기 때문에, 수백만 명이 생명을 잃었거나 단축되었다.
6장에서는 5장의 심각한 주제 이후 독자에게 분위기 전환이 되길 바란다. 6장은 역설에 관한 장이다. 몬티홀 역설Monty Hall paradox, 심슨의 역설Simpson’s paradox, 버크슨의 역설Berkson’s paradox 등등. 이와 같은 고전 역설들은 퍼즐이라고 생각하고 즐길 수 있지만, 특별히 인과 시점으로 바라볼 때, 생각해 볼 부분도 있다. 사실, 이것들 대부분은 인과 직관과의 충돌을 나타내고, 따라서 직관의 구조를 해부한다. 이들은 인간직관은 통계적이 아닌 인과적 논리에 기반한다는 사실을 일깨워줬어야 했던 “탄광 안의 카나리아”(번역가주-위기 상황을 조기에 예고해 주는 역할)였다. 독자들이 사랑받는 오래된 역설들에 새로운 전환을 즐길 것이라 믿는다.
7~9장에서는 마침내 독자들이 인과사다리의 윗 층으로 짜릿하게 안내된다. 7장에서는 학생들과 내가 개입의 문제로 시작하고, do-류의 질문에 대답하는 것을 자동화하는데 20년동안 노력한 이야기를 한다. 우리는 성공했다. 이 장은 “인과추론 엔진”의 핵심을 설명하는데, 그림I.1의 예/아니오 답변과 estimand 를 제공한다. 이 엔진을 공부하면 독자들은 인과질의에 대답을 바로 전달하는 인과다이아그램의 패턴을 골라내는 능력이 생길 것이다. 이 패턴들은 실제 인과추론의 일꾼들인데 뒷문보정, 앞문보정, 도구변수instrumental variable라고 부른다.
8장에서는 반사실을 논의하면서 여러분을 사다리의 꼭대기로 데려간다. 반사실이 인과성의 기반이 된 것은 적어도 1748년 이후였는데, 스코틀랜드 철학자 데이비드 흄David Hume이 인과성을 다음과 같이 다소 왜곡되게 정의한 때였다. “원인을 한 실체 뒤에 다른 실체가 뒤따르는 것으로 정의할 수 있는데, 여기서 첫번째와 유사한 모든 실체 뒤로 두번째와 유사한 실체가 뒤따른다. 다른 말로 하면, 첫번째 실체가 없었다면, 두번째 실체는 절대 존재할 수 없었을 것이다.” 2001년에 사망한 프린스턴 대학의 철학자 데이비드 루이스David Lewis는 흄이 실제로 하나가 아닌 두 개의 정의를 했다고 지적했다. 첫번째 정의는 정규성(즉, 원인은 결과가 정규적으로 따라나온다.)이고 두번째 정의는 반사실이다(“첫번째 실체가 없었다면”). 철학자들과 과학자들이 대부분 정규성 정의에 주목했지만, 루이스는 반사실 정의가 인간 직관과 더 밀접하게 궤를 같이 한다고 주장했다. “우리는 원인을 차이를 만드는 것으로 생각하고 차이는 그것 없이 일어났을 것과의 차이이어야 한다.”
독자들은 학문적 논쟁을 과거로 보내고, 반사실 질의가 아무리 복잡해도, 실제 값(혹은 확률)을 계산할 수 있다는 것을 알게되면 놀랄 것이다. 관찰한 사건의 필요충분 원인과 관련된 질문들이 특별히 관심있는 질문이다. 예를 들어, 피고의 행동이 고발인의 부상의 필요 원인일 가능성은 얼마나 되나? 인류가 만든 기후변화가 기온 상승의 충분원인일 가능성은 얼마나 되나?
마지막으로, 9장은 중개mediation 주제를 다룬다. 인과다이아그램에서 화살표를 그리는 것에 대해 이야기 했을 때, 약물이 혈압 \(Z\) (중개자mediator)에의 효과를 통해서만 수명에 영향을 준다면 \(D\) 에서 수명 \(L\) 로 화살표를 그려야 할지에 궁금했을 수 있다. 다른 말로 하면, \(D\) 의 \(L\) 에의 효과가 직접적인가 간접적인가? 둘 다에 해당하면, 상대적 중요성을 어떻게 측정해야하나? 이러한 질문들은 과학적인 관심이 많은 주제이기도 하지만, 실제적으로 파급효과가 생긴다. 즉, 약물이 작용하는 메카니즘을 이해하면, 더 저렴하거나 부작용이 적지만 같은 효과를 가지는 다른 약을 개발할 수 있을 것이다. 독자들은 중개 메카니즘의 오래된 탐험이 어떻게 산수문제가 되었는지와, 과학자들이 이러한 문제들을 풀기 위해 인과도구 키트에 있는 새로운 도구들을 어떻게 사용하고 있는지 재미있게 살펴볼 것이다.
10장에서는 처음에 나를 인과추론으로 안내한 문제로 돌아가면서 책을 마무리한다. 바로 인간수준 지능을 자동화하는 문제(때로 “강한 AI”라고 함)이다. 나는 기계들이 정책, 실험, 설명, 이론, 후회, 책임감, 자유의지, 의무에 대해 인간의 언어로 인간과 소통하기 위해 인과추론이 필수적이라고 믿는다. 궁극적으로는 그들만의 도덕적 결정을 하기 위해서도 그러하다.
이 책의 메시지를 간결한 문구로 요약하면 다음과 같을 것이다. 데이터보다 당신이 더 똑똑하다. 데이터는 원인과 결과를 이해하지 못하지만 인간은 이해한다. 인과추론이라는 새로운 과학은 인간의 방식을 더 잘 이해할 수 있게 해 줄 것인데, 우리 자신을 모방하는 것보다 우리 자신을 더 잘 이해할 수 있는 방법이 없기 때문이댜. 컴퓨터 시대에 이 새로운 깨달음은, 데이터가 크든 작든 더 잘 이해할 수 있는 타고난 능력을 증폭시킬 미래도 함께 가져올 것이다.
예외가 하나 있는데, 4장에서 볼, 랜덤화 통제실험을 수행하는 경우이다.↩︎