책 읽어주는 공대생 (사회과학)
누군가에게 수학은 가장 무서운 무기이다
『대량살상 수학무기』
공대상상 예비 서울공대생을 위한 서울대 공대 이야기 Vol. 28
캐시 오닐 지음, 김정혜 옮김, 흐름출판, 2017
글: 김재원, 전기정보공학부
3 / 편집: 유윤아, 기계항공공학부
2
SNS에 단체사진을 올릴 때 친구의 얼굴이 인식되어 태그가 되어있고, 야구장에서 타자가 타석에 들어서기도 전에 그가 공을 칠 수 있을지 예측할 수도 있습니다. 이처럼 일상생활 곳곳에 쓰이는 빅데이터는 정보화 시대의 원유라고 할 수 있습니다. 빅데이터에 대한 정의는 다양하지만, ‘3V’라는 개념을 도입해 쉽게 정의할 수 있는데요. 빅데이터 프로세싱 기술은 거대한 규모(Volume), 다양한 형식(Variety)의 데이터를 빠른 속도(Velocity)로 분석하여 사용자에게 전달하는 기술입니다. 그런데 우리가 빅데이터 기술의 편리함을 누리고 있는 지금 이 순간, 같은 기술이 무시무시한 수학 무기로 변해서 누군가의 숨통을 서서히 조여가고 있다면 믿어지시나요?
미국 펜실베이니아의 레딩은 석탄 산업의 쇠퇴 그리고 2008년의 금융위기로 인해 미국에서 가장 가난한 도시가 되고 맙니다. 레딩은 재정 악화로 줄어든 경찰 인력을 효율적으로 배치하기 위해 범죄 예측 소프트웨어를 도입하게 되는데요. 이 소프트웨어로 각 범죄의 유형, 장소 등의 데이터를 이용해 범죄 발생 가능성이 높은 지역을 도출했고, 이 지역에 더 많은 경찰을 배치하였습니다. 언뜻 보면 합리적인 것처럼 보이는 이 알고리즘에는 치명적인 불평등이 숨어 있었습니다. 통상적으로 가난한 동네에서 미성년자 음주, 쓰레기 투기 등의 경범죄가 빈번하게 일어나기 때문에 그 지역의 범죄 데이터가 많아졌고, 이 데이터로 인해 더 많은 경찰이 배치되었습니다. 집중된 경찰 배치로 인해 더 많은 경범죄자가 체포되는 악순환이 계속되었습니다. 정작 적발해야 할 살인, 금융사기 등 중범죄의 적발에는 도움이 되지 못한 채 말입니다.
이 책의 저자인 캐시 오닐은 이런 불투명하고, 불공정하며, 악순환을 야기하는 알고리즘들을 ‘대량살상 수학무기’(WMD, Weapons of Math Destruction)●라는 표현을 써서 비판하고 있는데요. 지금도 세상은 가난이라는 꼬리표를 붙이는 WMD로 가득 차있습니다. 신용 상태가 나쁘고 범죄 발생률이 높은 곳에 사는 사람들을 손쉽게 찾아내고는 고금리 대출을 광고하고, 무거운 형량을 선포하며, 일자리를 얻을 기회마저 차단합니다. 이런 피해자들의 대부분은 빚의 구렁텅이로 떨어지는 순간에도 자신이 약탈당했는지조차 알아챌 수 없습니다.
그렇다면, WMD에 의한 피해는 왜 잘 알려져 있지 않은 걸까요? 그 이유는 크게 두 가지 정도로 보이는데요. 먼저 빅데이터를 분석할 때 쓰이는 ‘기계학습 알고리즘’에서는 개발자조차 현재 이 모델이 정확히 어떤 상태인지 알기가 힘듭니다. 모델 자체가 수많은 계층(layer)들이 데이터를 접할 때마다 가중치(weight)가 바뀌는 식으로 설계되었기에, 인간의 뇌로는 수천 차원, 수만 계층의 숫자들을 한 눈에 파악할 수 없습니다. 모델의 설계자도 잘 모르는데, 피해자들이 알 방법이 없겠죠. 두 번째로, 부유한 사람들은 자신들에게 우호적인 모형이 다른 사람들의 삶을 어떻게 파괴하는지에 대해서 관심이 없습니다. 휴가지나 값비싼 포도주를 추천 받는 이들에게 약탈적인 모형은 본인들이 볼 수 없는 ‘블랙박스’여야 합니다.
위의 이유들은 제가 이 책을 독자분들께 소개해드리고 싶은 이유와 일맥상통합니다. 미래의 공학자가 될 여러분들이 도덕적인 상상력을 길러서, 효율적인 기술을 개발하면서도 그 속에 더 나은 윤리적 가치를 담았으면 합니다. 물론, 이 기사를 쓰고 있는 저부터 노력을 해야겠네요. 이제는 위험한 총이나 균이 아닌, ‘수학’으로도 사람을 죽일 수 있게 되었으니 말입니다.
주해
● WMD는 원래 대량살상무기 (Weapons of Mass Destruction)를 일컫는 말이다. 저자는 WMD의 ‘Mass’를 ‘Math’로 바꾸어 표현함으로써 잘못된 알고리즘의 심각성을 살상무기에 빗대어 강조했다.