|
📚 책소개
수많은 경고에도 우리가 계속 틀리는 이유
인간의 본능적인 숫자 편향에 주목한 이 시대의 필독서
2022년 3월 9일 7시 30분, 당신은 대선 출구조사 발표를 보고 어떤 기분이 들었는가? 그 결과에 환호했든 아쉬워했든, 한편으로는 ‘출구조사가 과연 맞겠어?’ 하며 의심의 눈길을 보냈을지 모른다. 2016년 트럼프를 대통령으로 뽑은 미국 대선에서도 많은 신문이 사전 여론조사가 크게 빗나갔다고 주장했지만, 오차범위를 고려한다면 대체로 여론조사 예측은 정확했다. 게다가 여론조사와 선거 결과의 차이는 2012년 오바마의 당선 때보다 훨씬 작았지만, 어떠한 언론사도 그 선거 결과를 예측하지 못했다.
사실 오차범위를 고려했다면 트럼프의 당선은 전혀 놀랄 일이 아니었다. 하지만 사람들, 특히 언론사들은 자신들이 지지하고 기존에 예측했던 후보의 당선을 확실시했다. 모두 해석하고 싶은 대로 여론조사 결과를 바라보고 기사를 쓴 결과였다. 바로 인간의 본능적인 숫자 편향이 만든 사건이었다. 위험한 것은 인간이다. 그리고 인간의 위험한 숫자 편향을 잘 아는 사람들에 의해 숫자는 위험해진다. 아무리 지식이 많다고 해도 여전히 우리가 틀리는 이유다. 《위험한 숫자들》은 수의 함정을 경고하면서도 그 근본적인 원인을 지적하는 최초의 책이다.
숫자가 없는 세상을 상상해보라. 우리는 경제통계, 시험점수, 여론조사 결과는 물론이고 중환자실 병상이 몇 개 남았는지, 백신이 효과가 있는지 등을 알지 못할 것이다. 말 그대로 숫자가 세상을 가른다. 당신은 숫자가 이끄는 대로 살아가는 사람이 될 것인가, 숫자 뒤의 진실을 꿰뚫어보는 사람이 될 것인가? 《위험한 숫자들》의 마지막 페이지를 덮는 순간, 당신은 숫자를 제대로 사용하는 사람이 될 것이다.
👩🏫 저자 소개
사너 블라우
유럽 전역을 뒤흔든 크라우드펀딩 저널리즘의 시초 《코레스폰던트De Correspondent》의 수학 전문기자. 에라스무스대학교 경영대학원과 틴버겐연구소에서 계량경제학으로 박사학위를 받았다. 네덜란드 고등연구소Netherlands Institute for Advanced Study, NIAS 전속 저널리스트이기도 하다.
블라우가 몸담고 있는 《코레스폰던트》는 새로운 시선을 담은 양질의 기사를 내보이기 위해 출범했으며, 펀딩이 시작된 지 불과 8일 만에 1만 7,500명의 구독자와 100만 유로(한화 약 13억 4000만 원)를 모으며 주목받았다. 《코레스폰던트》는 중요하게 다루는 주제는 물론 구독자들을 잠재적 기여자로 생각한다는 점에서 기존의 미디어와 차별화된다. 예컨대 빈곤층에게 생활비를 지급하고 주당 15시간을 일하도록 하자는 기사에 “이주 문제와 더불어 통합에 대한 사회, 문화적 측면을 간과하면 안 된다”라는 내용의 긴 댓글이 달리자, 기자가 해당 댓글을 작성한 독자에게 기사를 작성해달라고 요청하기도 했다.
사너 블라우는 《코레스폰던트》에서 코로나바이러스 통계, 인공지능, 미래 예측 등에서 숫자가 어떻게 사용되는지 심층 취재했다. 아울러 구독자들로부터 숫자의 오용에 관한 사례들을 수집하고, 우리를 본능적으로 틀리게 만드는 숫자들이 어디서 오는지 연구했다. 이러한 노력을 바탕으로 출간된 그녀의 첫 책 《위험한 숫자들》은 구독자들의 성원에 힘입어 네덜란드에서 오랜 기간 베스트셀러로 자리매김했다. 그리고 영국, 독일, 이탈리아, 포르투갈 등 10개국에서 번역 및 출판되며 유럽 전역에서 많은 사랑을 받고 있다.
📜 목차
새로운 사회를 맞이하여_수의 팬데믹 시대를 살아가는 사람들에게
머리말_숫자는 거짓말을 한다
1장_우리는 언제부터 숫자에 집착하기 시작했을까?
우리가 숫자에 열광하게 된 최초의 계기│표준화의 시작│수치를 대규모로 모으기 시작하다│수치를 분석하기 시작하다│직감, 오류, 이해관계 무너뜨리기
2장_만들어진 숫자들이 세상을 지배한다
“차라리 흑인이 똑똑하다는 걸 발견했더라면 저도 좋겠어요”│몇 가지 중요한 유의사항│다섯 가지 주관적 선택│그럼에도 숫자 덕분에 밝혀진 진실
3장_수상쩍은 렌즈를 통해 바라본 ‘성’ 이야기
통계학자 세 명이 킨제이에게 묻다│잘못된 질문│조사에서 빠진 사람들│인터뷰 집단이 너무 소규모다│무작위 표본, 문제의 해결책인가?│참여하고 싶지 않은 사람들│오차범위를 간과하다│특별한 결과가 필요한 사람들
4장_흡연이 폐암을 일으킨다는 분명한 사실이 의심받은 이유
통계로 거짓말하기│히틀러가 수백만 명의 목숨을 구할 뻔했다?│가장 음흉한 마케팅 기법│우연의 일치, 빠진 요인 그리고 역인과관계│어디까지 알면 충분한가?│흡연 통계로 거짓말하는 법
5장_틀리지 않는 계산 기계는 없다
이 시대의 가장 위험한 발상 중 하나│알고리즘이란 도대체 무엇일까?│알고리즘의 위험한 활용│쓰레기가 들어가면 나오는 것은 쓰레기다│알고리즘도 혼동하는 상관관계 vs 인과관계│숫자가 오히려 진실을 바꾸어버렸다│수로 무엇을 얻길 원하는가?
6장_숫자 본능을 이기는 힘
틀린 연구 결과가 왜 계속 나올까?│좋지 않는데도 좋게 느껴지는 해석│숫자를 보면 어떤 감정을 느끼는가?│제1원칙, 한번 더 살펴보라!│불확실성 인정하기│상충하는 이해관계가 있는지 살펴보자
맺음말_이제는 수를 원래 자리로 돌려놓아야 할 때
체크리스트_숫자를 의심하는 연습
📖 책 속으로
그녀의 행복을 조사하고 있었지만, 텐트에서 생활하는 그녀의 삶을 표현할 만한 숫자가 존재하지 않음을 깨달았다. 후아니타는 또 다른 것도 가르쳐주었다. 그녀가 어떤 숫자를 말할지 내가 강한 영향력을 행사했다는 사실이다. 나는 행복이 중요하며 정량화할 수 있다고 미리 정해놓았다. 또한 도표를 사용하여 이 추상적인 질문들을 던지자는 발상을 내놓았다. 후아니타가 소득 불평등에 관해 뭔가를 말할 만큼 지적이지 않다고도 여겼다. 나, 나, 나, 결국은 나였다.
--- 「머리말, 숫자는 거짓말을 한다」중에서
가난과 범죄에 관한 수치, 주민등록 기관, 우리가 매일 신문에서 보는 평균값과 도표 등은 모두 채 200년도 안 된 19세기에 뿌리를 두고 있다. 이 모든 것은 난데없이 등장하지 않았다.
--- 「1장, 우리는 언제부터 숫자에 집착하기 시작했을까?」중에서
지능과 피부색에 관한 주장은 언제나 평균을 다룬다. 한 집단의 평균이 다른 집단의 평균보다 낮다는 식이다. 그런데 두 평균 뒤에 점수들의 전체 범위가 놓여 있다. 웩슬러지능검사 점수에 따르면 많은 흑인 미국인이 평균적인 백인 미국인보다 더 지능이 높다. 이렇게 말할 수도 있다. 많은 백인 미국인이 평균적인 흑인 미국인보다 점수가 낮다. 즉 이런 종류의 평균은 개개인의 점수와는 거의 무관하다.
--- 「2장, 만들어진 숫자들이 세상을 지배한다」중에서
지능과 피부색에 관한 주장은 언제나 평균을 다룬다. 한 집단의 평균이 다른 집단의 평균보다 낮다는 식이다. 그런데 두 평균 뒤에 점수들의 전체 범위가 놓여 있다. 웩슬러지능검사 점수에 따르면 많은 흑인 미국인이 평균적인 백인 미국인보다 더 지능이 높다. 이렇게 말할 수도 있다. 많은 백인 미국인이 평균적인 흑인 미국인보다 점수가 낮다. 즉 이런 종류의 평균은 개개인의 점수와는 거의 무관하다.
--- 「2장, 만들어진 숫자들이 세상을 지배한다」중에서
표본 조사의 관건은 양이 아니라 대표성이다. 바로 그런 면에서 킨제이의 연구방법에 문제점이 있었다. 보수적인 기독교 공동체, 공장 지대, 시골 마을 등 킨제이가 들르지 않았던 장소가 많았다. 흑인들도 완전히 배제되었다. 다른 집단들(동성애자들, 학생들, 중서부 지역 사람들)은 대표성이 부족했다.
--- 「3장, 수상쩍은 렌즈를 통해 바라본 ‘성’ 이야기」중에서
담배 업계의 목표는 흡연이 건강에 좋다고 증명하는 일이 아니었다. 담배의 해악에 의구심이 드는 정도만으로 이미 충분했다. 오크룸 회의 이후 담배산업연구위원회는 흡연에 관한 과학 연구의 발견에 혼란을 조장하기 위해 할 수 있는 모든 일을 했다. 프록터는 이렇게 썼다. “목표는 ‘발견해내지 못하도록 연구하기’였으며, 그다음으로는 ‘흡연과 건강 관련 연구에 막대한 돈을 쏟아부었지만 해로움이 증명되지 않았다고 주장하기’였다.”
--- 「4장, 흡연이 폐암을 일으킨다는 분명한 사실이 의심받은 이유」중에서
‘수는 세상의 모습을 만드는 원인이자 동시에 결과이기도 하다’ 신용점수도 마찬가지다. 특정한 성향을 지닌 사람들일수록 대출을 받기가 더 어려워지는데, 그러면 더 빠르게 가난에 내몰리게 되어 대출받기가 훨씬 더 어려워지고, 그 결과 가난이 더 가속화하는 식이다. 이와 같은 알고리즘들은 자기가 내놓은 예측을 자기가 실현하는 자기충족적 예언가가 되어버린다. 진실을 파악해야 하는 수가 진실을 바꾸어버리는 셈이다.
--- 「5장, 틀리지 않는 계산 기계는 없다」중에서
숫자가 그릇되게 사용되고 있음을 알아차리고 싶다면 추론의 오류를 파악하고 자신의 직감을 이해하는 것이 중요하다. 하지만 아마도 가장 중요한 질문은 이것이다. 수 뒤에 누가 있는가? 그 사람이 결과에 이해관계가 있는가?
--- 「6장, 숫자 본능을 이기는 힘」중에서
🖋 출판사 서평
기후위기, 신용점수, 수능등급, GDP ……
만들어진 숫자들이 세상을 지배한다
신용점수는 삶을 결정하는 숫자다. 신용점수가 낮으면 당신은 신용카드를 발급하지 못한다. 새로운 사업을 시작하지도 못한다. 신용점수가 어느 정도 있어야 은행에서 각종 대출을 받을 수 있으며, 점수가 높다면 우대이율까지 받을 수 있다. 어느 회사에서는 신용점수로 구직자를 평가한다. 비단 신용점수만의 이야기가 아니다. GDP를 통해 국가에 등급이 매겨지고, 수능등급으로 학생들의 12년의 노력이 평가받는다. 숫자로 평가하는 세상이다.
하지만 이러한 숫자들은 모두 우리가 만들어냈다. 편의 또는 어떠한 목적을 갖고서.
전시 상황이 되자 국민소득 개념은 곤란하기 짝이 없었다. 정부는 복지보다 무기에 돈을 쓰고 싶었는데, 그 개념에 따르면 그런 정부 지출은 국민소득의 감소를 의미하므로 결과적으로 전쟁 지원을 약화시킬 터였다. 그래서 해결책으로 찾아낸 것이 GDP라는 다른 측정값이었다. GDP는 정부에서 생산된 것(이를테면 무기)을 포함하여 국가에서 생산된 모든 재화와 서비스의 총 가치를 측정한다. 이에 따르면 새로 만든 폭격기도 경제에 이로웠다. GDP는 오로지 정치적 의도로 탄생한 수치였다.
2장, 〈만들어진 숫자들이 세상을 지배한다〉 중에서
코로나19 바이러스의 확산 방지 조치들 때문에 네덜란드인들은 담배를 더 많이 피웠고, 실업자가 되었고, 우울증에 걸렸다. 반면 현황판에 생활방식, 고용, 정신건강에 관한 수치들은 담기지 않았다. 우선순위가 다른 수들에게 있었기 때문인데, 의료활동에 과도한 부담을 지우지 않고 바이러스에 취약한 이들을 보호하기 위해서였다. 통계에 따른 판단이었을 뿐만 아니라 도덕적 판단이기도 했다.
새로운 사회를 맞이하여, 〈수의 팬데믹 시대를 살아가는 사람들에게〉 중에서
신용점수가 높은 사람은 정말 성실할까? 시험점수가 높은 학생은 똑똑할까? GDP가 높은 국가는 선진국이라고 할 수 있을까? 진실을 포착해야 할 숫자가 오히려 진실을 바꿔버렸을 수도 있다. 이런 숫자들을 확고하게 자리잡힌 것으로 여기는 순간, 편견과 차별이 탄생한다. 컴퓨터가 모든 것을 계산하는 지금 시대에도 마찬가지다. 컴퓨터는 객관적인 숫자를 만들지 못한다. 인간이 컴퓨터에 데이터를 입력해야 하는 지금, 컴퓨터가 계산하는 결과는 결국 인간이 만들어낸 숫자들의 합이다. 우리는 만들어진 숫자들의 굴레에서 벗어날 수 없기에 숫자 뒤의 진실을 꿰뚫어볼 눈을 갖춰야 한다.
빅데이터 시대 숫자를 판단하는 뜻밖의 신호, 인간의 숫자 편향
당신의 감정을 알아차리고 판단하라!
《위험한 숫자들》은 인간이 왜 계속 숫자 실수를 저지르는지 근본적인 원인을 밝힌 첫 번째 책이다. 사실 숫자들에 대한 경고는 오래전부터 있었다. 숫자가 만들어졌다는 사실 외에도 상관관계를 인과관계와 혼동한다거나, 오차범위를 고려해야 한다거나, 대표성이 없는 표본추출을 경계해야 한다는 등이 그 예다. 하지만 이 모든 경고에도 사람들은 동성애에 관한 낭설을 진실인 양 이야기하고, 알코올이 건강에 좋을 수도 있다고 생각하거나, 담배가 폐암을 일으킨다는 분명한 사실까지 의심한다.
우리는 왜 계속 틀릴까? 예일대학교 교수 댄 카한과 그의 연구팀은 허구의 피부연고 임상실험에 관한 도표 하나를 실험 참가자들에게 보여주고 까다롭게 계산하도록 했다. 그 결과 수학시험에서 높은 점수를 받은 사람들이 정답을 내놓는 경향이 있었다. 하지만 또 다른 실험의 결과는 달랐다. 총기 규제에 관한 도표를 주고 똑같이 계산하도록 하자, 수학을 잘하는 사람들도 틀린 결과를 내놓았다. 심지어 이전의 수치들과 난이도가 똑같은 도표였는데도!
카한은 실험 참가자들이 내놓은 답들은 진리와 더 이상 관련이 없다고 주장했다. 그 답들은 참가자의 정체성이나 자기가 속한 집단과의 소속감을 지켜내기 위한 것이었다. 수학을 잘하는 사람들도 매한가지였다. 그들은 종종 자신도 모르게 그런 답을 내놓았다. 자신들의 심리 상태로 스스로를 속인 셈이다. 즉 사람들은 사실을 더 많이 알고 더 큰 재능이 있을 때 스스로를 속이는 일도 많아진다. 우리 뇌는 변호사처럼 작동한다. 다시 말해 우리의 확신을 방어하기 위한 주장을 기어코 찾아낸다.
6장, 〈숫자 본능을 이기는 힘〉 중에서
“술 한 잔으로 수명이 30분 단축될 수 있다”라는 표제를 보면 당신은 어떤 감정을 느끼는가? 터무니없는 소리라는 생각이 드는가? 혹시 당신은 이틀에 한 번꼴로 와인이나 맥주를 마시지 않는가? 숫자가 그릇되게 사용되고 있음을 알아차리고 싶다면 자신의 감정을 이해하는 것이 중요하다. 자신은 왜 그 숫자를 보고 기뻐하거나 분노하는가? 혹시 내가 그 숫자에 이해관계가 있는 것은 아닌가? 수많은 이해관계가 충돌하고 있는 복잡한 현대사회에서 오로지 숫자에 관한 지식만으로는 정답을 알 수 없다. 당신의 감정을 알아차리고 판단하라!
《휴먼카인드》 저자 뤼트허르 브레흐만 강력 추천
“블라우는 우리가 그토록 바랐던 최고의 선생이다”
저자 사너 블라우는 유럽 전역을 뒤흔든 크라우드펀딩 저널리즘의 시초 《코레스폰던트》의 수학 전문기자이자 네덜란드 고등연구소 전속 저널리스트로, 촉망받는 숫자 전문가다. 코로나바이러스 통계, 인공지능, 미래 예측 등에서 숫자가 어떻게 사용되는지 심층 보도한 기사들로 유명하다. 또한 보통 사람들도 쉽게 이해할 수 있도록 심리, 역사, 사회 이슈 등을 풍부하게 담아내, 그녀의 첫 책 《위험한 숫자들》은 암스테르담의 시장 펨커 할세마가 직접 나서서 ‘수를 헤아릴 줄 모르는 사람들’에게 권하기도 했다.
블라우는 ‘숫자 편향’이 대중들에게 국한된 이야기가 아니라 자신과 같은 숫자 전문가들에게도 얼마든지 일어난다는 점을 꼬집는다. 50년 동안 수많은 통계 전문가가 담배가 폐암과 관련이 없다고 옹호한 이유, 지금까지도 회자되는 유명한 킨제이 성보고서, 기온 변동이 거의 없어 보이는 보수성향 잡지의 기후변화 그래프 …… 모두 전문가들이 옳다고 믿어서 생산한 숫자들이었다. 그리고 저자 역시 예외는 아니었다.
나는 중요한 요소 하나를 간과했다. 음주가 아무 문제 없다는 결론에 특히 신이 났음을 깨달았을 때, 프라사드의 트윗을 다시 한번 읽어보았다. 음주가 해롭지 않다는 말은 어디에도 없었고 다만 그 연구에 결함이 있다는 내용이었다. 카한의 연구처럼 나는 내 소속집단에 맞는 해석을 골랐다. 옳은 해석이 아니라 옳다고 느껴지는 해석이었다. 나는 그런 식으로 해석하는 데 능했다. 직업상 그런 유형의 연구를 반박할 온갖 주장을 알고 있기 때문이다. 알고 보니 나의 뇌도 변호사처럼 움직였다.
6장, 〈숫자 본능을 이기는 힘〉 중에서
자신이 옳다고 믿는 숫자 전문가들을 상대로 우리는 어떻게 진실을 볼 수 있을까? 블라우는 숫자를 의심하는 연습만이 답이라고 말한다. 숫자를 마주할 때마다 그 숫자 전달자가 누구인지, 숫자는 표준화된 수치인지, 어떻게 수집되고 분석되었는지, 어떤 형태로 제시되었는지, 무엇보다 본인은 어떤 감정을 느꼈는지 스스로에게 질문을 던지는 연습 말이다.
수는 복잡한 현실을 그대로 반영한다고 알려져 있지만, 실은 현실을 근사해낼 뿐이다. 알베르트 아인슈타인은 “의미 있다고 해서 모두 셀 수는 없으며, 셀 수 있다고 해서 모두 의미 있지는 않다.”라고 했다. 블라우의 《위험한 숫자들》을 통해 숫자를 의심하는 습관을 만들고 숫자로 만든 세상에서 길을 잃지 않길 바란다.