골턴이 상관관계와 회귀는 두 가지 개념이 아니라
똑같은 개념을 바라보는 두 가지 다른 관점이라는 것을 이해하기까지 여러 해가 걸렸다.
이 일반적 규칙은 간단명료하지만 그 결과는 롤랍다.
두 측정치 사이에 상관관계가 완벽하지 않다면 의레 평균으로 회귀한다는 것이다.
골텅의 통찰력을 제대로 이해하기 위해 , 대다수의 사람들이 재미있어하는 다음 진술을 보자,
대단히 똑똑한 여성은 자기보다 덜 똑똑한 남성과 결혼하는 성향이 있다.
파티에서 위 진술을 설명해보라고 한다면 흥미로운 대화를 유도할 수 있고,
사람들은흔캐히 의견을 낼 것이다.
그리고 통계를 조금 안다는 사람도 곧바로 인과관계 해석을 내놓기 쉽다.
아주 똑똑한 여자는 똑같이 똑똑한 남자와의 경쟁을 피하려 한다거나,
아니면 똑똑한 남자는 똑똑한 여자와 경쟁하길 원치 않으니
여자가 배우자를 선택할 때 타협할 수밖에 없다거나 하는 해석이다.
그리고 이보다 훨씬 더 황당한 설명도 나올 수 있다. 이제 다음 진술을 보자.
두 배우자의 지능지수 사이의 상관관계는 완벽하지 않다
이 진술은 누가 봐도 옳고, 전혀 흥미롭지 않다.
두 수치 사이에 완벽한 상관관계가 있다고 생각하는 사람이 어디 있겠는가? 설명하고 말고 할 것도 없다.
그런데 앞의 흥미로운 진술과 뒤의 시시한 진술이 수학적으로는 동일하다.
두 배우자 지능의 상관관계가 완벽하지 않다면(그리고 남자와 여자가 지능이 평균적으로 다르지 않다면)
아주 똑똑한 여자가 평균적으로 자기보다 덜 똑똑한 남자와 결혼하는 것은 수학적으로 불가피하다.
(남자와 여자가 바뀐 경우도 마찬가지다.)
여기서 나타나는 평균회귀는 불완전한 상관관계보다 더 흥미롭지도, 해명이 더 그럴듯해 보이지도 않는다.
회귀 개념을 이해하느라 애를 먹은 골턴에 공감하는 사람도 있을 것이다.
통계학자 데이비드 프리먼(David Freedman)은
형사 재판이나 민사재판에서 회귀라는 주제가 등장한다면,
배심원에게 회귀를 설명해야 하는 쪽이 재판에서 질 것이라고 이야기하곤 했다.
회귀 설명이 왜 그러게 힘들까? 그 주된 이유는 이 책에서 반복되는 주제 때문이다.
그러니까 우리 머리는 인과관계 설명에 지나치게 편향되어 있어서
'오직 통계와 관련한 사실'은 잘 다루지 못한다.
어떤 사건에 주의가 집중되면 우리 연상기억은 그 원인을 찾으려 한다.
더 정확히 말하면, 기억에 저장된 원인이란 원인은 모조리 들춰 내려 한다.
히귀라는 느낌이 들 ㄸ도 인과관계 해명이 떠오르는데, 그 해명은 엉터리다.
평균 회귀는 설명될 수 있어도, 인과관계는 없다.
골프 경기에서 우리 주의를 끄는 사건은
첫날 성적이 좋았던 선수들이 다음 날 부진에 빠지곤하는 것이다.
이에 대한 최선의 설명은 그 선수들이 첫날에는 운이 특별히 좋았다는 것인데,
이 설명에는 우리가 좋아하는인과관계가 부족하다.
우리는 회귀 효과에 대한 그럴듯핞 해명을 듣고 싶어서 큰돈을 들여 자문을 구하기도 한다.
하지만 방송에 나와 "올해 결기가 좋은 이유는작년에 안 좋았기 때문"이라고
정확히 지적하는 경제 평론가는 방송을 오래 하기 힘들다.
회귀 개념을 이해하기 힘들게 하는 장본인은 시스템 1과 시스템2, 둘 다다
특별한 설명이 없다면, 그리고 통계 설명을 어느 정도 한 뒤에도 상당한 경우에,
상관관계와 회귀 사이의 관계는 여전히 모호하다.
시스템2가 그것을 이해하고 배우기가 쉽지 않다.
시스템1이 인과관계 해석을 끊임없이 요구하기 때문이기도 하다.
우울증 아이에게 자양강장 음료 3개월 이상 먹이면 큰 효과
내가 지어낸 신문 기사 제목이다. 그러나 내용만큼은 사실이다.
우울증이 있는 아이들에게 일정 기간 자양강장 음료를 먹이면,
임상적으로 상당한 개선 효과를 볼 수 있을 것이다.
그런가 하면 우울증이 있는 아이들이 일정 시간 동안 물구나무서기를 하거나
하루에 20분씩 고양이를 안고 있어도 개선 효과를 기대할 수 있다.
이런 제목을 읽는 사람들은 대부분 그 즉시 자양강장 음료를 마시거나
고양이를 안는 행위가 우울증 개선의 원인이었다고 추론하겠지만, 그런 결론은 당치 않다.
우울증이 있는 아이들은 극단적인 집단에 속해서, 다른 아이들보다 더 우울해하는데
극단적 집단은 시간이 흐르면서 평균으로 회귀한다.
여러 번의 연속한 테스트에서 나온 우울증 점수 사이의 상관관계는
완벽하지 않으므로 평균으로 회구할 것이다.
다시 말해, 우울증이 있는 아이들은 구태여 고양이를 끌어안거나
자양강장 음료를 마시지 않아도 시간이 흐르면서 어느 정도는 호전될 것이다.
자양강장 음료가 (또는 다른 어떤 처방이) 효과가 있다고 결론 내리려면
이 처치를 받은 환자 집단을 처치를 받지 않은 (또는 위약을 받은) '통제집단'과 비교해야 한다.
통제집단은 회귀만으로도 개선된 결과가 나올 테고,
그렇다면 처치를 받은 환자는 회귀로 설명되는 수준 이상의 개선을 보였는지 알아봐야 한다.
회귀 효과를 인과관계로 잘못 해석하는 경우는 비단 일반 신문이나 ㄴ지 독자에만 해당하지 않는다.
통계학자 하워드 웨이너는 단순한 상관관계를 인과관계로 혼동해
똑같은 실수를 지지른 유명 연구원의 명단을 길게 나열하기도 했다.
회귀 효과는 연구에서 흔히 나타나는 골칫거리라서
노련한 과학자는 근거 없는 인과관계 추론의 덫을 두려워하는 건전한 경계심을 키운다.
직관적 예측의 오류를 보여주는 사례로 내가 즐겨 사용하는 것 하나는
맥스 베이저먼(Max Bazerman)의 뛰어난 글
《판단과 결정(Judgment in Managerial Decision Making)》에 나온 사례를 약간 변형한 것이다.
어느 백화점 체인의 매출을 예측해 달라는 요청을 받았다고 해보자,
모든 지점은 규모와 상픔 구성이 비슷하지만, 위치나 경쟁 그리고 무작위 요소들 탓에 매출 실적이 다르다.
이 상황에서 2011년 매출 실적을 토대로 2012년 매출을 예측해야 한다.
매출이 전반적으로 10퍼센트 늘 것이라는 경제 전문가들의 일반적 예측을 반영하라는 지시도 있었다.
아래 표를 어떻게 완성하겠는가?
지점 | 2011년 | 2012년 |
2 2 3 4 총계 | $11,000,000 $23,000,000 $18.000,000 $29,000,000 $81,000,000 | ㅡㅡㅡㅡㅡㅡㅡㅡ ㅡㅡㅡㅡㅡㅡㅡㅡ ㅡㅡㅡㅡㅡㅡㅡㅡ ㅡㅡㅡㅡㅡㅡㅡㅡ $89,100,000 |
이 17장을 읽은 사람이라면 각 지점의 매출이 10퍼센트를 더하는 뻔한 해법은 틀리다는 것쯤은 잘 안다.
회귀도 적용해야 한다. 그러려면 매출 실적이 낮은 지점은 10퍼센트 넘게 더하고,
다른 지점은 그보다 덜 더해야 한다.(어떤 곳은 빼야 한다.)
하지만 일반 사람들에게 이 문제를 풀라고 하면 당혹스러운 답이 돌아올 것이다.
뻔한 문제를 왜 묻는가?
그러나 골턴이 어렵게 발견했듯이 회귀 개념은 결코 뻔하지 않다.
ㅡ
평균 회귀와 관련한 말들
"그는 자기가 경험해보니 칭찬보다 비판이 더 효과적이라고 말한다.
그가 경험한 사례가 사실은 모두 편균으로 회귀했을 뿐이라는 점을 그는 모르고 있다."
"그의 두 번째 인터뷰가 첫 번째 인터뷰만큼 인상적이지 못한 까닭은
우리를 실망시키지 않아야 한다는 그의 부담감 때문일 수도 있지만,
첫번째 인터뷰가 워낙 좋았기 때문일 가능성이 더 높다."
"우리 심사 절차는 문제가 없지만 완벽하지는 않아서, 회귀가 생길 가능성을 예상해야 한다.
최고의 후보가 종종 우리 기대에 못 미치더라도 놀라지 말아야 한다."
275-280