16 인과관계는 통계를 이긴다.
아래 시나리오를 보고 질문에 직관적으로 대답해보라
밤에 택시 한 대가 뺑소니 사고에 연루되었다.
이 도시에는 '그린'과 '불루', 택시 회사가 운영 중이다.
관련 자료는 아래와 같다.
ㅇ 이도시의 택시 중 85퍼센트는 그린, 15퍼센트는 불루 소속이다.
ㅇ 목격자는 사고 택시가 불루하고 했다. 법정은 사고 당일 바모가 꼭같은 상황에서
목격자의 신빙성을 점검했고, 그 결과 목격자가 두 회사 택시를 제대로 알아본 경우가
80퍼센트, 잘못 알아본 경우가 20퍼센트였다.
사고에 연루된 택시가 그린이 아니라 불루일 화룰은 얼마일까?
전형적인 베이즈 추론 문제다, 정보는 두 가지다.
기저율과 목격자 증언의 불완전한 신뢰성, 목격자가 없다면,
불루 택시가 유죄일 확률은 기저율에 해당하는 15퍼센트다.
또 두 회사가 규모가 같았다면 기저율은 의미가 없고
오로지 목격자의 신뢰성만을 고려해 불루일 확률은 80퍼센트가 된다.
그런데 이 경우는 두 정보가 베이즈 규칙에 따라 결합되어, 정답은 41퍼센트다.
그런데 이 문제에 맞닥뜨린 사람들이 어떻게 대답했을지 짐작이 가지 않는가.
이들은 기저율은 무시한 채 목격자 증언만 따진다.
그 결과 거의 공통적으로 80퍼센트라고 대답한다.
인과관계의 전형성
이제 똑같은 이야기를 기저율만 살짝 바꿔보자
관련 자료는 아래와 같다.
ㅇ 두 회사가 운영하는 택시 수는 같지만, 그린 택시는 사고의 85퍼센트에 연루되었다.
ㅇ 목격자와 관련한 내용은 앞의 문제와 같다.
위 두 문제는 수학적으로는 구분이 안 되지만, 심리적으로는 사뭇 다르다.
첫 번째 문제를 읽은 사람은 기저율을 어떻게 사용해야 할지 몰라 무시하기 일쑤다
반면에 두 번째 문제를 본 사람은 기저율에 상당한 비중을 두고 ,
따라서 이들의 추정치 평균은 베이즈 정리에서 나온 답과 크게 다르지 않다. 왜 그럴까?
첫 번째 문제에서 블루 택시의 기저율은 그 도시에서 운행하는 택시에 관한 통계적 사실이다.
인과고나계 이야기에 굶주린 사람이 이러니저러니 할 만한 내용이 아무것도 없다.
도시에서 운행되는 그린 택시와 블루 택시 수가 어떻게 뺑소니의 원인이 될 수 있겠는가?
반면에 두 번째 문제에서는 그린 택시 기사가 블류 택시 기사보다 사고를 다섯 배 넘게 많이 낸다.
그렇다면 결과는 뻔하잖은가. 그린 택시 기사들은 무모한 미치광이 집단이 틀림없다!
이제 그린 택시 기사의 무모함이라는 전형적인 모습이 만들어졌고,
이 모습은 그린 택시 회사의 알 수 없는 개별 기사들에게 적용된다.
이 전형성은 인과관계 이야기에딱 들어맞는ㄷ.
무모함은 흔히 개별 기사와 관련한 사실이기 때문이다.
그렇다면 이 문제에는 결합되거나 중재되어야 하는 두 가지 이노가관계 이야기가 있다.
하나는 무모한 그린 택시 기사에게 책임을 돌리기 쉬운 뺑소니 사고이고
또하나는 사고 기가사 블루 택시 회사 소속임을 강하게 암시하는 목격자 증언이다.
이 두 이야기에서 나온 추론은 서로 모순되어 상쇄 효과를 일으킨다.
그 결과, 두 택시가 확률이 거의 같게 나온다.
(베이즈 규칙에서 나온 블루 택시의 사고 발생 추정치는 41퍼센트로, 이는 그린 택시의 기저율이
블류 택시를 지목한 목격자의 신뢰도보다 영향력이 약간 더 크다는 뜻이다.)
택시의 예는 기저율의 두 가지 유형을 보여준다.
'통계 기저율'은 해당 사례가 속한 모집단과 관련한 사실이며, 개별 사건과는 관련이 없다.
반면에 '인과관계 기저율'은 개별 사례가 어떻게 그렇게 되었는가를 바라보는 개인읜 시각을 바꾼다.
이 두 가지 기저울 정보는 다음과 같이 달리 취급된다.
ㅇ 통계 기저율은 해당 사례와 관련한 ㅌㄱ정 종보가 있을 때도 흔히 과소평가되고
더러는 아예 무시된다.
ㅇ 인과관계 기저율을 해당 개별 사례와 관련 있는 정보로 취급되고,
다른 개별 사례 정보와도 쉽게 결합한다.
인과관계가 담긴 두 번째 택시 문제에는 그린 택시 기사가 위험하다는 전형성이 담겼다.
전형성은 집단에 간한 진술로, (적어도 일시적으로는 )
그 집단에 속한 모든이에게 해당한다고 간주된다. 두 가지 예를 보자
도시 빈민 지역의 이 학교를 졸업한 학생들은 대부분 대학에 진학한다.
프랑스에서는 사이클링에 대한 관심이 널리 퍼져 있다.
이 진술들은 한 집단엔 속한 개인들에게서 나타나는 성향을 규정한 것으로 해석되고,
인과관계 이야기로 손색이 없다.
이 특별한 학교를 졸업한 학생 대다수가 대학에 가고싶어 하고 또 실제로 진학하는데,
아마도 이 학교의 어떤 유익한 특성 때문일 것이다.
그리고 프랑스의 문화적 사회적 삶에는
많은 프랑스인을 사이클링에 관심 갖게 하는 어떤 힘이 있을 것이다.
사람들은 이 학교의 어떤 졸업생을 떠올리며 그가 대학에 진학할지 안 할지 생각해볼 때,
또는 어떤 프랑스 사람을 이제 막 만났는데
그 사람 앞에서 투르드프랑스 사이클링 대회 이야기를 꺼낼지 말지 고민할 때,
위의 사실들을 떠올릴 것이다.
시스템1의 기본 특징 하나는 일정한 범주를 표준, 원형, 전형 등으로 나타내는 것이다.
우리가 말, 냉장고, ㄴ욕 경찰관 등을 생각할 때도 그런 식이다.
우리는이런 범주에 속하는사람이나 사물을 대표하는 하나 이상의 표준'을 정해 그 집단의 대ㅛㅍ이미지로 기억한다.
이때 그 대표 이미지를 '전형'이라고 말한다.
전형적 이미지는 더러 치명적으로 잘못 만들어지기도 하고, 적대적으로 만들어진 이미지는 심각한 결과를 초래할 수도 있지만,
러릿속에서 전형이 마드러지는 현상을 피할 수는 없다.
옳든 그르든 전형은 우리가 범주를 생각하는 방식이다.
여기서 모순을 눈치챈 사람도 있을 것이다.
택시 문제에서 보면 기저율 정보를 무시하는 것은 베이즈 추론을 외면한 인지 결함이지만,
인과관계 기저율에 의존하는 것은 바람직하다.
그린 택시 기사들을 전형화하면 판단의 정확도가 높아진다. 그러나 채용이나
프로파일링(개인을 인조, 나이, 경제력 등 여러 특징에 따라 범주화해 미래의 행동을 예측하는 것) 같은
다른상황에서는 전형화에 반대하는강력한 사회규범이 존재해 더러는 법률로 정해질 정도이며, 마땅히 그래야 한다.
민감한 사회적 맥락에서 개인을 판단할 때 그가 속한 집단의 통계를 근거로 잘못된 판단을 내려서는 안 된다.
우리 사회는 기저율을 개인을 판단하는 사실로서가 아니라 집단에 관한 통계적 사실로 취급하는 것이
도덕적으로 바람직하다고 여긴다.
한마디로, 인과관계 기저율을 거부한다.
프로파일링 반대를 비롯해 전형화에 반대하는 사회규범은 더욱 문명화하고 더욱 평등한 사회 건설에
대단히 이롭게 작용해왔다.
그러나 타당한 전형화마저 외면한다면 최선의 판단을 내리기 어렵다는 점을 기억해야 한다.
전형화 거부는 도덕적으로 칭찬받을 만하지만,
전형화 거부에 시간이나 수고 등의 비용이 들지 않는다는 단순한 생각은 잘못이다.
더 나은 사회를 위해 비용 지출이야 얼마든지 감수할 일이지만,
비용이 든다는사실 자체를 거부해 내면의 가치와 정치적 정당성을 획득한다면 과학적 정당성이 떨어진다.
감저 어림짐작에 의존하는 이런 태도는 정치색이 짙은 주장에서 흔히 나타나,
내가 지지하는 입장은 비용이 안 들고 내가 반대하는 입장은 득 될게 없다고 생각한다.
결코 성숙한 태도라 할 수 없다.
252-257