상관없는 것에서 연관성을 찾는 오류
우리는 패턴을 찾는 동물로 진화해 왔다. 우리의 조상들은 끊임없이 현상의 원인을 탐구했다. 물론 이런 탐구는 우리에게 도움이 되기도 한다. 우리를 새로운 지식으로 인도해 주기 때문이다. 그러나 원인을 찾는 천부적인 성향이 너무 강해서, 상관이 없는 것들에서 연관성을 찾기도 한다. 둘 사이에 전혀 관계가 없는데도 둘이 연결되어 있다고 믿는 것이다. 연관성을 바라거나 연관성이 있으리라고 기대할 때는 더더욱 이런 실수를 범한다.
먼저 아래의 <그림>을 보라. 그림이 무엇으로 보이나? 공룡 아니면 새나 웃은 얼굴? 비행중인 사람?
대부분의 임상심리학자들과 정신의학자들은 열 개의 비슷한 이미지들로 이루어진 이 로르샤흐 잉크 테스트로 환자에게 편집증이나 자살 성향 같은 특정한 장애나 성향이 있는지를 진단한다. 그런데 어떤 식으로 진단을 하는 걸까? 환자가 이 이미지에서 본 것을 말하면, 심리학자가 환자의 반응을 특정한 병이나 사회적 성향을 암시하는 무의식의 깊은 생각들과 연관을 짓는 것이다.
당신은 이 그림에서 무엇을 보았는가? 엉덩이나 여자의 옷, 허리 아래는 남자인데 허리 위는 여자 같은 사람처럼 성별이 모호한 사람의 이미지를 보았다면 임상심리학자는 당신에게 동성애적 성향이 있다고 진단할 것이다. 실제로 심리학자 로렌과 채프먼은 동성애를 장애의 하나로 여기던 시기에 서른두 명의 임상의들에게 로르샤흐 잉크 테스트로 남성 간의 동성애를 진단해 내는 것에 대해 물었다. 그러자 임상심리학자들은 잉크 무늬를 엉덩이나 성기, 여자의 옷, 성별이 불분명한 양성의 특징을 다 갖춘 사람의 모습으로 해석할 가능성이 동성애자들에게 더 많다고 답했다.
그렇다면 무엇이 문제란 말인가? 사실은 이런 반응 중 어떤 것도 동성애와 연관이 없다는 것이다. 연구 결과, 이성애자들도 동성애자만큼이나 많은 이런 반응을 보였다. 그런데도 임상의학자들은 이런 반응과 동성애 사이에 연관성이 있다고 확신한다. 왜 이런 오류를 범하는 것일까? 동성애자들은 이런 이미지를 보리라는 가정은 얼핏 이치에 맞는 것처럼 여겨진다. 그러나 이런 가정은 틀린 것이다. 그들의 생각이 동성애와 관련이 있으리라는 임상의학자들의 기대가 실제로도 존재하지도 않는 연관성을 만들어낸 것뿐이다.
이런 기대를 더욱 깊이 고찰하기 위해서, 로렌과 채프먼은 학부생들에게 서른 장의 카드를 주었다. 카드에는 잉크 무늬와 이 잉크 무늬에 대한 환자의 반응, 이 환자의 색다른 정서적, 성적 특성과 인성이 기재되어 있었다. 카드를 나눠준 뒤, 학생들에게 동성애자들이 특히 많이 보인 반응이 있었느냐고 물었다. 그러자 순진한 학생들은 심리학자들이 언급한 표시 - 여자의 옷이나 항문, 혼란스러운 성별 인식 등 - 를 동성애자들이 더 자주 얘기했다고 답했다. 그러나 이 서른 개의 진단 카드는 무작위로 만든 것이었다. 환자의 반응과 카드에 기재된 환자의 성 지향성 사이에는 어떤 연관성도 없었다는 말이다. 그런데도 학생들은 연관성을 찾아냈으며, 이 연관성은 많은 임상의들이 찾아낸 것과 똑같았다. 요컨대 아직 미숙한 학생들과 임상심리학자들 모두 똑같은 함정에 빠져 있었다. 잘못된 기대로 있지도 않은 연관성을 찾아낸 것이다.
로르샤흐 잉크 테스트에 대한 다른 반응들도 비슷한 문제를 보여준다. 환자가 “고양이가 거울을 들여다보고 있는 게 보여요”와 같은 반사반응을 보이면, 임상의들은 보통 환자에게 자기도취적인 성향이 있다고 해석한다. 반사반응과 자기도취 사이에 아무런 연관성이 없다는 연구 결과가 있는데도 말이다. 요컨대 로르샤흐 잉크 테스트의 신빙성과 타당성은 과학적으로 입증되지 않았다.
로르샤흐 잉크 테스트 외의 다른 투사법(projective test)들에도 비슷한 문제들이 존재한다. 예를 들어 인물화 그림 검사를 실시할 경우, 임상의는 환자가 그린 얼굴을 보고 환자의 심리상태를 파악한다. 로렌과 채프먼은 임상의들에게 편집증 환자들이 얼굴을 어떤 식으로 그릴지 물어보았다. 그러자 임상의 중 91%가 편집증 환자들은 눈을 부정형으로 그릴 것이라고 답했다. 그러나 통제 실험 결과, 편집증 환자가 그린 눈과 정상인이 그린 눈에는 차이가 없었다. 임상의들이 생각하는 연관성은 순전히 착각에 지나지 않는 것이다.
하지만 임상의들은 이런 결과를 알면서도 계속 이 검사법을 쓰고 있다. 이와 관련해서 어느 임상의는 다음과 같이 말했다. “편집증 환자들이 실험실에서 눈을 크게 그리지 않는다는 것은 저도 압니다. 하지만 제 진료실에서는 진짜로 눈을 크게 그려요.” 환자들의 반응과 병 사이의 연관성을 정확하게 인식할 수 있다고 믿는 임상의들의 착각으로 얼마나 많은 오진이 이루어지고 있는지도 짐작만 할 수 있을 뿐이다.
또 다른 예로, 필적 학자들은 개인의 필적을 분석하면 여러 가지 성격적 특성을 알아낼 수 있다고 주장한다. 그래서 그들은 글의 내용 대신 T자의 가로획을 어떤 식으로 긋는지, O자를 어떻게 그리는지 등을 분석한다. 그러나 실험 결과, 필적학은 전혀 쓸모가 없는 것으로 나타났다. 단적인 예로, ‘전문’ 필적 학자에게 여러 개의 육필 표본을 주고 분석을 의뢰했다. 이 중에는 똑같은 표본들도 들어 있었다. 그 결과 필적 학자는 똑같은 표본도 아주 다르게 분석했다. 유럽의 대기업체 85%와 약 3000개에 달하는 미국 내 주식회사에서 직원 채용 시 필적학자를 고용했다는 사실은 생각만 해도 끔찍하다. 당신도 필적학자의 근거 없는 분석에 고배를 마신 적이 있었는지 모른다.
이러한 연구 결과들은 두 변수 사이에 관계가 있다고 생각하면, 증거에 상관없이 실제로 연관성을 인식하는 경우가 흔하다는 점을 보여준다. 이처럼 실제로는 존재하지도 않는데 연관성이 있다고 인식하는 현상을 일컬어 착각적 상관(illusory correlation)이라고 한다.
의사들이 환자의 반응과 병, 성격 특성들 사이에서 어떤 연관성을 보는 것은 둘 사이에 정말로 연관성이 있어서가 아니라 연관성이 있으리라는 의사들이 기대 때문이다. 이런데도 매일 사람들은 이런저런 정신과 관련된 문제들을 치료하기 위해 투사법을 사용하는 임상심리학자나 정신의학자들을 찾아간다. 게다가 심리학자들은 아이의 보호를 부모 중 누구에게 맡겨야 하는지, 죄수를 가석방시켜도 되는지, 유죄선고를 받은 살인자를 어떻게 처리해야 하는지 등등에 대한 법정의 판결을 돕는 데도 이 테스트를 이용한다. 이로 인해 신빙성이 떨어지는 투사법의 진단 결과를 근거로 해마다 중요한 결정들이 수없이 내려지고 있다.
* 출처: 토머스 키다 지음, 박윤정 옮김(2007). 생각의 오류. 열음사. pp 183 ∼ 193.(요약)
-------------------------------------------------------------------------
What’s Wrong With the Rorschach? Science Confronts the Controversial Inkblot Test
DONALD F. KLEIN, M.D., New York, N.Y.
Published Online: 1 Mar 2004
For many years, the Rorschach test was viewed as the psychometric equivalent of psychoanalysis. It pierced through psychic defenses, gaining a clear picture of affects and conflicts, conscious and unconscious, as well as the intactness of thought processes. Many thought that the Rorschach could make the diagnostic decision as to whether a patient might possibly be psychotic. The blot’s ambiguity was a great benefit because patients would not realize what they were revealing and, therefore, could not defend against revealing it. The revered experts were Klopfer and Beck. More recently, John Exner and Irving Weiner provided detailed rules for interpretation of Rorschach scores.
This book starts with an engaging clinical anecdote in which one author presents an analysis of his own Rorschach and then details how it is a very poor fit to his life experiences and personality. The book provides details of systematic research indicating that such interpretations were not factually based but, rather, based on presumptions. Of particular concern is the frequent, unjustified use of the Rorschach as definitive in forensic matters and critical clinical evaluations. There is an engaging, lucid review of relevant research and controversies. In particular, the authors’ critique of the Exner comprehensive system is trenchant.