대표성에 기댄 예측
순서 매기기의 세 번째 실험은 심리학과 대학원생들을 대상으로 실시했다.
대단히 중요한 실험으로, 각 전공을 톰 W가 현재 그 분야 대학원생일 가능성에 따라 순서대로 나열해야 했다.
이 예측 집단 사람들은 관련 통계를 알고 있었다.
서로 다른 분야의 기저율도 익히 알고 있고, 톰 W를 묘사한 글의 출처는 그다지 신뢰할 만하지 않다는 것도 알았다.
하지만 우리는 그들이 기저율도, 묘사의 정확성에 대한 의문도 무시한 채
전형적인 모습과의 유사성, 즉 우리가 '대표성'이라 부르는 것에만 집중하리라고 예상했다.
그런 뒤에 학생 수가 적은 전공(컴퓨터과학)에 가장 높은 순위를 매길 것이다.
그 분야의 대표성 점수가 가장 높기 때문이다.
이 실험 결과는 조금 뒤에 설명하게다.
아모스와 나는 유진에 머무는 동안 부지런히 연구했고, 나는 더러 연구실에서 밤을 지새웠다.
그때 내가 한 일 하나는 대표성과 기저율이 상충하는 성격 묘사를 만드는 것이었다.
톰 W도 이때 탄생했는데, 내가 작업을 완성한 때는 이른 아침이었다.
그날 아침에 연구실에 가장 먼저 나타난 사람은 우리 동료이자 친구인 로빈 도스(Robyn Dawes)였다.
똑똑한 통계학자이자 직관적 판단의 유효성에 회의적인 사람으로,
내 문제에서 기저율의 관련성을 발견하는 사람이 있다면 그는 분명 로빈일 것이었다.
그날 아침 나는 로빈을 불러, 이제 막 타이핑한 문제를 주면서 톰 W의 전공을 맞혀보라고 했다.
나는 그가 머뭇거리며 "컴퓨터과학?"이라고 말하면서 씩 웃던 모습을 아직도 기억한다.
내겐 정말 행복한 순간이었다. 비록 위대한 인간은 몰락했지만!
물론 내가 "기저율"이라고 말하는 순간 로빈은 곧바로 자기 실수를 바로잡았지만, 처음부터 그 생각을 하지는 못했다.
그는 예측에서 기저율의 역할을 누구보다도 잘 아는 사람이었지만,
개인의 성격을 묘사한 글을 내밀자 기저율을 무시했다.
예상대로 그도 확률 추정을 대표성 판단으로 바꿔치기한 셈이다.
아모스와 나는 주요 대학 세 곳의 심리학과 대학원생 114명에게 똑같은 문제를 주었다.
모두 통계 수업을 여럿 들었던 학생이다. 이들도 우리를 실망시키지 않았다.
아홉 가지 분야에서 이들이 매긴 순위도 전형적인 모습과의 유사성에 따른 순위와 다르지 않았다.
이 경우에는 바꿔치기가 완벽했다.
실험 참가자가 대표성 판단 외에 다른 판단을 했다는 표시는 어디에도 없었다.
확률(가능성) 문제는 어렵지만 유사성 문제는 그보다 쉬우니, 문제를 바꿔 대답한 것이다.
유사성 판단과 확률 판단에 적용하는 논리는 엄연히 다르다는 점을 생각하면, 심각한 실수다.
유사성을 판단할 때 기저율이나 묘사의 부정확성에 영향을 받지 않는 것은 얼마든지 있을 수 있는 일이지만,
확률을 판단할 때 기저율과 증거의 질을 무시하는 사람은 틀림없이 실수를 저지르게 마련이다.
' 톰 W가 컴퓨터과학을 전공할 화률'이란 개념은 단순하지 않다.
논리학자와 통계학자는 그 의미를 서로 달리 해석하고,
또 누군가는 아무 의미도 없다고 말할 것이다.
많은 전문가에게 그것은 주관적 믿음의 정도를 측정하는 것이다.
세상에는 우리가 확신하는 사건도 있고(오늘 아침에 해가 떴다),
불가능하다고 여기는 사건도 있다.(태평양이 한꺼번에 얼어버렸다.).
그런가 하면 절만만 믿는 사건도 많은데(옆집 사람은 컴푸터과학자다.).
이때 그 믿음의 정도가 사건이 일어날 확률이다.
논리학자와 통계학자는 이제까지 확률을 서로 다르게 정의했고, 둘 다 대단히 정확하다.
그러나 보통 사람들에게 확률(일상적인 말로 하면'가능성')은
불확실성, 일정한 성향, 그럴듯함, 놀람과 관련 있는 모호한 개념이다.
이 모호함은 확률에만 해당하는 것은 아니며, 특별히 문제랄 것도 없다.
우리는 '민주주의'니 '아름다움'이니 하는 말을 쓸 때, 그 말의 의미를 거의 다 알고 있으며,
상대방도 우리가 무슨 말을 하려는지 이해한다.
나는 수년간 수업을 하면서 확률에 관해 질문을 던졌지만,
누구도 손을 들고 '교수님, 확률이 무슨 뜻인가요?"라고 묻는 사람은 없었다.
'글로버빌리티(Globability)' 같은 듣고 보도 못한 개념을 평가해보라고 했다면, 무슨 뜻이냐고 물었을 것이다.
하지만 확률 문제에서는 모두 내 질문에 대답하는 법을 안다는 듯이 행동했다.
그 단어 뜻을 새삼 설명해보라고 한다면 다들 너무한다고 생각하겠지만,
사람들은 어떤 사건의 확률을 질문받아도 당혹스러워하지 않는다.
통계학자나 철학자처럼 확률을 판단하지는 않기 때문이다.
확률 문제는 머릿속 산탄총을 자극해 더 쉬운 문제로 바꿔 대답하게 한다.
쉽게 대답하는 방범 하나는 그 자리에서 대표성을 평가하는 것인데,
언어를 이해할 때 흔히 사용하는 방법이다.
'엘비스 프레슬리의 부모는 아들이 치과 의사가 되었으면 했다'는 (가짜) 진술은 은근히 웃긴다.
플레슬리의 이미지와 치과 의사의 이미지의 부조화가 곧장 감지되기 때문이다.
스스템 1은 무의식적으로 유사성을 감지한다.
어떤 사람이 '그는 선거에서 승리할 것이다. 잘 보면 알 수 있다'라거나
'그는 학자가 될 사람은 아니다. 문신 많은 거 보라'라고 한다면,
대표성 어림짐작이 끼어든 것이다.
어떤 후보의 턱 선이나 힘 있는 말투를 보고
공직자 후보로서의 지도력을 논한다면 대표성에 기댄 판단이다.
대표성에 기댄 예측은 흔한 일이지만 통계적으로는 적절치 않다.
마이클 루이스(Michael Lewis)의 베스트 셀라 《머니볼Moneyball》은
이런 식의 예측이 얼마나 비효율적인가를 보여주는 이야기다.
프로야구에서 선수를 스카우트할 때는 전통적으로 체격과 겉모습으로도 선수의 성공 가능성을 일부 점친다.
《머니볼》에 나오는 영웅인 오클랜드 애슬레틱스 구단장 빌리 빈(Billy Beane)은
스카우트 담당자들의 의견을 무시한 채, 경기 성적 통계로 선수를 선발했다.
선발된 선수들은 몸값이 낮았다. 다른 팀에서는 선발하지 않은 탓이다.
오클랜드 애스레틱스는 얼마 안 가 적은 비용으로 훌륭한 성적을 올렸다.
226-229