안녕하세요. 새날입니다.
1주차는 책 소개와 ‘1장 밀크셰이크 딜레마, 2장 그들의 선택에는 일이 있다’
2주차 ‘3장 야생의 할 일, 4장 할 일 사냥, 5장 그들이 고용한 것과 해고한 것’
3주차 ‘6장 이력서 작성하기, 7장 과정의 최적화’를 같이 읽어 보았습니다.
이 책의 마지막 주차인 이번 주는 ‘8장 빅데이터의 함정, 9장 통제와 효율성 제고’를 살펴보겠습니다.
〈 읽고, 정리하기 〉
8장 빅데이터의 함정
“소비자는 4분의 1인치짜리 드릴의 구매를 원치 않는다. 그들은 4분의 1인치 구멍을 원할 뿐이다.” 이 심오한 통찰은 수십 년 전에 하버드대학의 전설적 마케팅 교수 테오도르 레빗Theodore Levitt이 널리 알린 이론으로 고객은 제품을 원하는 게 아니라 문제에 대한 해결안을 원한다는 의미입니다.
대부분의 성공한 회사들은 처음에는 고객의 할 일을 찾아내야 한다는 관점에 입각하여 출발을 했을 것입니다. 그러나 일단 성공적으로 시장에 진출한 이후에는 그들에게 성공을 가져다준 ‘해야 할 일’ 개념이 회사가 운영되고 성장하는 과정에서 실종됩니다. 이는 할 일 기준이 아니라 제품 기준으로 그들 자신을 정의하는 것이 원인일 것입니다.
실제로 제품이 개발되어 시장에 출시되는 날, 관리자들에게는 모든 게 바뀌게 됩니다. 성장 압박이 너무 크기 때문에 왜 고객이 자사 제품을 고용했는지 그 이유를 제대로 파악하지 못합니다. 심지어 대기업도 고객의 할 일보다는 자사의 일을 완수하는 데 집중합니다. 이런 일이 발생하는 이유는 회사가 제품 데이터에 관해 세 가지 오류에 빠지기 때문입니다.
첫 번째는 능동적 데이터 대 수동적 데이터의 오류입니다. 할 일의 해결안을 찾아내는 데 필요한 많은 정보가 갈등의 맥락 속에서 발견됩니다. 이러한 정보를 수동적 데이터라고 부릅니다. 수동적 데이터는 그 자체로는 세상이 어떻게 돌아가는지를 우리에게 말해주지 못합니다. 그래서 여과하지 않은 맥락이고 언제나 현존하지만 목소리가 크지 않습니다.
관리자들은 그들의 특성상 각종 정보에 민감하게 반응합니다. 특히 해야 할 일이 상업적 제품으로 구체화되면 그것을 적절한 맥락에서 파악하는 관점은 뒤로 밀려나게 됩니다. 영업의 능동적 데이터가 이노베이션의 수동적 데이터를 대체하고 치환하기 때문입니다. 이에 스프레드시트 라는 명확한 숫자로 관심을 쏟게 됩니다. 영업 관련 데이터는 매우 크고 분명하게 자신을 홍보하기 때문에 관리자들은 할 일 대신에 숫자를 관리하게 됩니다. 회사의 정보를 걸러내는 계층이 많을수록 이런 현상이 두드러집니다.
두 번째는 표면 성장의 오류입니다. 회사가 고객과의 관계 개선에 큰 투자를 할 때 자연스럽게 기존 고객에게 더 많은 제품을 파는 방법을 알고 싶다는 욕구가 생겨납니다. 기존 고객에게 더 많은 제품을 판매하는 한계비용은 매우 작고 거기에서 생기는 수익은 매우 유혹적입니다. 이것을 ‘표면 성장’이라 부릅니다. 회사는 다른 업체가 만든 제품이 성공하면 그 제품을 모방하거나 매수하려 듭니다. 하지만 이 방법은 많은 고객을 위한 더 많은 제품을 만들어내는 것에 그치고 맙니다. 그리하여 당초 그들에게 성공을 안겨주었던 할 일에 대한 초점을 잃어버리게 됩니다. 더 나아가 많은 고객을 위해 많은 할 일을 하려 드는 건 고객을 혼란스럽게 만들어 엉뚱한 할 일을 위해 엉뚱한 제품을 고용하게끔 만듭니다. 그 결과 고객은 그 제품에 절망감을 느끼고 그것을 해고해버립니다. 이런 회사는 하나의 할 일에만 집중하여 그 일을 잘 해내는 파괴적 회사에게 밀리게 됩니다.
세 번째는 데이터 조작의 오류입니다. 데이터는 우리가 원하는 의견과 관점에 맞추어 자신을 적응시키는 짜증나는 경향을 갖고 있습니다. 이에 저명한 통계학자인 네이트 실버는 이렇게 말합니다. “가장 치명적인 예측 실패 사례들은 공통점을 갖고 있다. 우리는 세상을 있는 그대로 보여주는 이야기보다 우리가 원하는 세상을 보여주는 이야기를 예고하는 신호에 집중한다.”
우리는 종종 입맛에 맞는 데이터만을 선택합니다. 그리고 우리의 결정이 객관적이라 착각합니다. 예를 들어 어떤 리더가 A와 B 중에서 A라는 중대한 결정을 내렸다고 가정해 봅니다. 이 경우 실제로는 모든 사실의 계층이 그런 결정을 내리도록 유도한 것에 불과합니다. 즉 각종 데이터가 A쪽으로 교묘하게 왜곡되어 있는 것입니다. 그 리더는 명확한 데이터에 근거하여 판단했다고 생각하겠지만, 실제로 그런 결정은 사전에 미리 정해진 것입니다. 결국 이노베이션은 경영진이 이노베이션이 해주기를 바라는 일들을 수행하도록 왜곡된 것이 됩니다. 그 결과 관리자들이 팔고 싶어 하는 제품을 고객이 사고 싶어 한다는 생각을 갖게 됩니다.
이노베이션을 위한 가장 건강한 마음가짐은 거의 모든 데이터가 인간의 편견과 판단에 바탕을 두고 만들어진 것임을 인정하는 일입니다. 그 데이터가 한쪽 극단의 입장에서 만들어진 양적 데이터이든 혹은 다른 한쪽 극단에서 만들어진, 행동을 주로 기술하는 인구통계학적 데이터이든 인간의 편견과 판단이 가미되어 있다는 것입니다. 숫자로 된 것이든 이야기로 된 것이든 데이터는 모두 복잡한 현실로부터 추상해낸 것입니다.
데이터는 현상이 아닙니다. 데이터의 일차적 기능은 현상을 재현하는 것, 즉 현실의 모상模像을 만들어내는 것입니다. 그런데 데이터에 관한 한 가지 오해가 많은 회사 내에 뿌리 깊이 박혀 있습니다. 그것은 오로지 양적 데이터만을 객관적으로 보는 시각입니다. 일련의 이상적 데이터를 취합한다면 고객에 대해 완벽한 통찰을 얻을 수 있다는 믿음이 널리 퍼져 있는 것입니다. 그래서 올바른 데이터를 정립하기만 하면 된다고 생각합니다. 간단히 말해 수량적 형태의 올바른 데이터, 이를테면 얼마나 많이? 무엇을? 어디에? 누가? 언제? 등 스프레드시트나 회귀분석 등에 대입할 수 있는 그런 정보만을 수집하면 ‘진실’을 알 수 있다는 것입니다. 반면에 질적 데이터, 즉 적절히 자르거나 처리하여 스프레드시트에 집어넣을 수 없는 관찰이나 통찰은 양적 데이터만큼 신뢰하지 않습니다. 그 중심에는 그들이 생각하는 단 하나의 진실도 들어 있지 않다는 이유에서입니다. 그에 비해 양적 데이터가 한결 더 정확하다고 믿습니다.
하지만 이것은 정확한 이야기가 아닙니다. 모든 데이터는 인간이 만든 것입니다. 어떤 사람이 어느 순간에 무슨 데이터를 수집할지, 그것을 어떻게 조직할지, 어떻게 제시할지, 그로부터 어떻게 의미를 추출할지 결정했습니다. 그 과정에는 온갖 그릇된 경직성이 담겨 있습니다. 데이터는 알든 모르든 그것을 작성한 사람의 것과 동일한 어젠다를 품고 있는 것입니다.
9장 통제와 효율성 제고
······ 생 략 ······
〈 새날의 생각 나누기 〉
이번 주는 8장과 9장을 같이 읽어 보았습니다. 이 중에 저는 ‘8장 빅데이터의 함정’에 대해 좀더 알아보려고 합니다. 책에서는 대부분의 회사들이 처음에는 고객의 할 일을 찾아내야 한다는 관점에서 출발을 했지만, 실제로 제품이 개발되어 시장에 출시되면 고객의 할 일보다는 자사의 일을 완수하는 데 집중한다고 합니다. 이런 일이 발생하는 이유는 회사가 제품이 만들어 내는 수많은 데이터로 인해 오류에 빠지기 때문입니다. 이를 벗어나기 위해서는 거의 모든 데이터가 인간의 편견과 판단에 바탕을 두고 만들어진 것임을 인정하는 것입니다. 다시 말해 데이터는 알든 모르든 그것을 작성한 사람의 것과 동일한 어젠다를 품고 있다는 것을 알아야겠습니다.
빅데이터에 관한 많은 책이 있지만 조금은 색다른 책, 데이비드 핸드 지음의 『다크데이터』라는 책이 있습니다. 책 제목에서 말하는 ‘다크 데이터dark data’는 온갖 유형의 누락된 데이터를 말합니다(이하 출처1 참조). 이 데이터는 우리가 볼 수 없게 숨겨져 있는데, 그 때문에 우리는 오해하고 틀린 결론을 내리고 나쁜 결정을 할 우려가 있다는 것입니다. 이에 따라 우리는 데이터에 미지의 것이 숨어 있을 가능성을 간과해서는 안됩니다. 만약 이를 알아차리지 못한다면 그 결과는 참담하거나 심지어 치명적일 수 있습니다. 이에 대한 보다 심층적 이해를 위해 몇 가지 사례를 뽑아 왔으니 참고 바랍니다.
의학에서 트라우마는 ‘중대한 손상이 장기적으로 일어날 수 있는 심각한 부상’을 가리킵니다. 트라우마는 조기 사망 및 장애를 초래하는 ‘수명 손실’의 가장 심각한 원인 중 하나이며, 40세 미만 인구의 가장 흔한 사망 원인이기도 합니다. 영국의 ‘트라우마 검사 및 연구 네트워크TARN’의 데이터베이스는 유럽 최대의 의료 트라우마 데이터베이스입니다. 이 네트워크는 200곳이 넘는 병원에서 트라우마 사건에 관한 데이터를 수집합니다. 그야말로 트라우마 진단 및 처치의 효율성을 연구하는 데 필요한 데이터의 보고라 할 수 있습니다.
영국 레스터대학교의 에프게니 미르케스Evgeny Mirkes 박사 연구팀은 이 데이터베이스의 일부 데이터를 살펴보았습니다. 그랬더니 165,559건의 트라우마 사례 중에서 결과가 알려지지 않은 사례가 19,289건이 있었습니다.
이때 결과가 알려지지 않은 환자를 제외한 146,270 명을 분석한 뒤에 그걸 바탕으로 진단을 쉽게 내릴 수도 있습니다. 왜냐하면 이 숫자는 결코 작지않은 큰 수니까 이 데이터를 바탕으로 결론을 내려도 문제가 없을 것 같아 보이기 때문입니다.
그러나 결과를 모르는 19,289건은 어쩌면 그렇게 내린 진단 결과와 매우 다를지도 모릅니다. 만약 그렇다면 오진, 틀린 처방, 부적절한 치료법으로 인해 환자들에게 불행하거나 심지어 치명적인 결과가 생길 수 있습니다. 때문에 많은 데이터, 그러니까 ‘빅데이터’가 있으면 좋긴 하지만 크기가 모든 것을 말해주지는 않습니다. 그리고 우리가 모르는 것, 가지고 있지 않은 데이터가 가지고 있는 데이터보다 상황을 이해하는 데 훨씬 더 중요할 수도 있습니다. 이런 다크 데이터의 문제는 단지 빅데이터에서만이 아니라 작은 데이터 세트에서도 생깁니다. 그야말로 어디에서나 생기는 문제입니다. 그러니 연구자들은 통계가 전체 집단의 속성을 잘 짚어내는지 의심해봐야 합니다.
2012년 10월 하순 허리케인 샌디, 일명 ‘슈퍼 태풍 샌디Superstorm Sandy’가 미국 동부 해안을 강타했습니다. 당시 샌디는 미국 역사상 두 번째로 크게 피해를 끼친 허리케인이자 대서양에서 발생한 허리케인 중 가장 큰 규모로 기록되었습니다. 추산 750억 달러에 이르는 재산 피해와 더불어 인근 8개국에서 200명이 넘는 목숨을 앗아갔습니다. 샌디는 플로리다에서 마인, 미시간, 위스콘신에 이르기까지 미국 24개 주에 영향을 끼쳤고, 정전 때문에 금융시장이 문을 닫는 사태까지 벌어졌습니다.
이 사건은 한편으로는 현대 미디어의 승리이기도 했습니다. 허리케인 샌디라는 진짜 폭풍이 닥쳤을 때 진행 상황을 설명하는 트위터 메시지의 폭풍도 함께 닥쳤습니다. 트위터는 무슨 일이 어디에서 벌어지는지뿐 아니라 누구한테 벌어지고 있는지도 알려주는 장점이 있습니다. SNS 플랫폼은 실시간으로 사건 현장 상황을 알려주는 수단이 되기도 합니다. 허리케인 샌디가 발생했을 때도 SNS는 제 몫을 톡톡히 해냈습니다. 2012년 10월 27일에서 11월 1일 사이에 샌디 관련 트윗은 2천만 건이 넘었습니다. 이 정도면 허리케인 진행 상황을 지속해서 추적할 수 있는 이상적인 데이터로 손색이 없을 듯합니다. 이 정보로 어느 지역이 가장 심각한 손해를 입었고 어디에 긴급 구조가 절실한지를 한눈에 파악할 수 있기 때문입니다.
하지만 나중에 분석해봤더니 샌디에 관한 트윗이 가장 많이 나온 곳은 맨해튼이었고, 로커웨이와 코니아일랜드 같은 지역에서는 트윗이 매우 적었습니다. 이 분석대로라면 로커웨이와 코니아일랜드에서 그만큼 피해가 심각하지 않았다는 뜻으로 해석됩니다. 그러나 맨해튼의 지하철과 거리가 물에 잠긴 것은 사실이지만, 그렇다고 맨해튼이 뉴욕에서 가장 심하게 타격을 입은 지역은 아니었습니다. 당연하게도 트윗이 적었던 지역은 허리케인 피해가 작은 게 아니라 트윗을 올릴 스마트폰, 곧 트위터 사용자가 적었다는 데 있었습니다.
실제로 이 경우에도 극단적인 상황을 상상해볼 수 있습니다. 만약 샌디가 어느 지역을 완전히 초토화했다면 트윗이 아예 올라오지 못했을 것입니다. 그리고 사람들은 그 지역 주민 모두가 무사하리라고 여겼을 것입니다. 이렇게되면 정말이지 심각한 다크 데이터가 아닐 수 없습니다.
고객이 쇼핑 카트를 가득 채운 채 슈퍼마켓 계산대 앞에 섭니다. 레이저가 각 물품의 바코드를 스캔하면서 물건값을 하나씩 더할 때마다 계산대에선 삐삐 소리가 울립니다. 이 과정이 끝나면 고객은 총액 청구서를 받고 결제를 합니다. 하지만 그게 끝이 아닙니다. 구매 내역과 각 물품의 가격이 기록된 데이터가 데이터베이스로 보내져서 저장되고 통계학자와 데이터 과학자가 그 데이터를 살펴서 고객의 소비행동 패턴을 뽑아냅니다. 무슨 물품을 샀는지, 어떤 물품들을 함께 샀는지, 그리고 어떤 부류의 고객이 특정 물품을 샀는지 등을 알아내는 것입니다. 슈퍼마켓이 고객에게 지불 금액을 청구하는 과정에서 정전이나 금전등록기의 고장 또는 고객의 부정행위가 없는 한 거래 데이터는 수집되게 마련입니다.
그러니 수집된 데이터가 해당 데이터의 전부라는 것은 누가 봐도 명백해 보입니다. 수집된 데이터는 거래의 일부 또는 구입 물품의 일부 내역이 아닙니다. 그 슈퍼마켓 안에 있는 모든 물품에 대해 모든 고객이 거래한 모든 것입니다. 간단히 말해서 ‘데이터=모든 것’입니다.
이 데이터는 지난주 또는 지난달에 무슨 일이 있었는지를 알려준다는 점에서 유용합니다. 하지만 슈퍼마켓을 운영하는 사람이 정말로 알고 싶은 것은 아마도 내일이나 다음 주 또는 다음 달에 무슨 일이 생기느냐일 것입니다. 정말로 알고 싶은 내용은 누가 무엇을 언제 사느냐, 그리고 그 물품을 나중에 얼마만큼 더 사느냐입니다. 진열대에 더 채워놓지 않으면 품절 가능성이 큰 물품은 무엇일까? 사람들은 앞으로 어떤 브랜드를 더 좋아할까? 이처럼 우리는 아직 측정되지 않은 데이터를 원합니다. 한술 더 떠서 우리는 다음과 같은 것을 알고 싶을지 모릅니다. 기존의 것과 다른 새로운 물품을 내놓았더라면, 그런 물품을 진열대에 새로운 방식으로 배치했더라면, 또는 슈퍼마켓 개점 시간을 바꾸었더라면 사람들이 어떻게 행동했을지 말입니다. 이것들은 실제 일어난 일과 다르다는 의미에서 반사실反事實이라고 합니다. 실제로 생긴 일이 생기지 않았더라면 무슨 일이 생겼을지를 문제 삼기 때문입니다. 반사실은 존재했을 수도 있는 데이터입니다. 이런 맥락에서 보면 ‘모든 것’은 아예 존재하지 않는 것이 됩니다. 이를 간과하고 고객과 거래한 모든 데이터가 있고, 그 데이터 속에 답이 있다는 식의 절대적 믿음은 경계해야할 것입니다.
〈 책 닫기 〉
지난 4주 동안 같이 읽어본 바와 같이 이 책은 ‘할 일 이론’을 중심으로 내용이 전개되었습니다. 이 책에서 말하는 ‘할 일 이론’은 회사가 어떻게 이노베이션을 수행하여 더욱 발전하고 성장할 것인가 하는 문제에 해답과 함께 명확한 지침을 제시합니다. 예를 들어 ‘지속가능한 성장을 위해 회사는 어떻게 이노베이션을 해야 하는가’, ‘새로운 기회를 발견하기 위해 구체적으로 어디를 살펴야 하고, 또 고객이 사들이기를 원하는 것에 부응하여 특별히 어떤 제품과 서비스를 제공해야 하는가’ 하는 질문들 말입니다.
사실 ‘이론’ 하면 으레 학문적이고 추상적인 이미지를 연상하기 쉽지만, 이 책의 할 일 이론은 우리에게 실제로 업무에 활용할 수 있도록 ‘어떻게’와 ‘왜’를 이해하는 데 도움을 주고, 또 세상이 돌아가는 방식을 이해하고 우리의 행동이 가져올 결과를 예측하게 해줍니다. 여기에 이론을 뒷받침하는 사례들, 밀크셰이크, 아마존, 에어비앤비, 서던뉴햄프셔대학, 아메리칸걸 인형, 이케아, 메이요클리닉, GM의 온스타, 유니레버 등의 성공 사례들은 많은 참고가 됩니다.
대부분의 기업들이 그렇듯이 소비자의 해야 할 일을 깊이 있게 이해하는 것은 실제로 매우 어려운 일입니다. 그것은 소비자가 자신이 무엇을 원하는 지를 명확하게 잘 표현하지 못하기 때문이기도 합니다. 설령 소비자가 자신이 원하는 것을 제대로 말해준다고 해도 때로 실제 행동은 전혀 다르게 나타나기도 합니다. 소비자의 행동에 관한 객관적인 데이터라고 하는 것도 종종 착오를 불러일으킵니다. 일종의 판매 데이터는 전적으로 큰 고용, 즉 소비자가 실제로 제품을 구매하는 순간에만 집중하고 작은 고용, 즉 소비자가 실제로 제품을 사용하는 순간은 무시하기 때문입니다. 큰 고용이 이루어질 때 어떤 제품이 소비자의 할 일을 진정으로 해결했다고 볼 수도 있지만 실제로는 작은 고용이 지속될 때 비로소 그것을 확인할 수 있습니다.
소비자가 새로운 제품을 고용하기 전에 기존의 어떤 제품을 해고하는지를 이해하는 과정 또한 매우 중요합니다. 이 과정을 중요하게 생각하지 않는 회사는 제품을 보다 매력적으로 만드는 일에만 집중할 뿐 해고된 제품을 어떤 제품으로 대체해야 하는지에 대해서는 심각하게 고려하지 않습니다. 하지만 소비자는 무언가를 구매하기 훨씬 이전에 어떤 제품을 해고하고 어떤 제품을 고용할지 결정을 내리는 과정에 들어갑니다. 이런 선택의 순간에는 변화를 강요하는 힘과 변화에 저항하는 힘이 갈등을 벌입니다. 이노베이터들은 종종 변화를 강요하는 힘에 지나치게 의존하는 나머지 변화를 가로막는 힘을 완전히 무시합니다. 소비자의 고민을 해결해줄 수 있는 새로운 제품이 충분히 매력적이라면 갈아타기를 유도할 수 있다고 생각합니다. 하지만 소비자는 더 좋은 것이 필요하다는 확신이 서지 않으면 현재의 것을 해고하기를 망설입니다.
이 같은 소비자의 제품 선택을 이해하려면 그들을 유심히 관찰하면서 상호작용하는 과정이 필요합니다. 그들이 고용하고 해고한 것에는 하나의 이야기가 있습니다. 그 이야기는 소비자의 발전 욕구에 따르는 기능적, 정서적, 사회적 차원을 말해주며 더 나아가 무엇이 그런 욕구를 가로막는지 얘기해줍니다. 그 과정에서 소비자의 구매와 관련한 각종 단서와 관찰한 사항을 종합할 수 있어야만 이노베이션 기회를 발견할 수 있습니다.
이노베이션을 잘 설명하하기 위해서는, 소비자의 할 일과 관련하여 집단적 이해를 강화하고 개선할 수 있는 공동의 언어가 필요합니다. 이 언어는 할 일 이론이 소비자가 진정으로 중요하게 여기는 것을 깊이 있게 통찰하는데 도움을 줍니다. 그래서 이 책의 제목을 『일의 언어』라고 붙였겠다 싶습니다.
종합하면, 할 일 이론은 경쟁을 새롭게 이해하여 세 가지 혜택을 가져다줍니다. 첫째, 제품의 차별화와 장기적인 경쟁우위를 제공합니다. 둘째, 회사가 고객의 행동을 이해하는 기준인 공동의 언어를 제공합니다. 마지막으로 회사 관리자들이 직원들에게 자사의 목표를 매우 정밀하게 설명하는 데 도움을 줍니다.
끝으로 이 책, 『일의 언어』를 통해 고객의 발전 지향적 문제 해결을 위한 이노베이션이 성공에 닿을 수 있도록 활용할 수 있는 것을 찾아 적용하여 소기의 성과를 이루고, 더욱 발전하고 성장하는 기업이 되었으면 좋겠습니다. 물론 그 과정에서 구성원의 행복이 함께 하면 더욱 좋겠습니다.
그럼 다음 주에는 새로운 책, 장원청 지음의 『심리학을 만나 행복해졌다』로 뵙겠습니다.
〈 참고 도서 〉
O 출처1: 『다크데이터』, 데이비드 핸드 지음, 노태복 옮김, 더퀘스트 출판, 2021.10.05 출간, 396 쪽, 다크데이터 - 교보문고 (kyobobook.co.kr)
〈 마인드 맵으로 한 장에 보기 〉
〈 소통과 성장의 장 〉
오픈채팅방 〈하루 문장 나누기〉: https://open.kakao.com/o/gZdfZGae, 참여코드: booklife