사진: Patrick Perkins / Unsplash
조금 모호한 이야기가 되겠지만, 데이터를 분석할 때 치열하게 생각하는 방법에 관해 이야기해 보려 한다.
“데이터 분석가에게 필요한 역량”에 대한 질문을 받을 때마다 가장 강조하고 싶은 게 “치열하게 생각할 줄 알아야” 한다는 것이지만 이런 얘기는 거의 하지 않는다. 너무 당연하다고 생각하기 때문이다. 코딩이나 통계처럼 훈련이 필요한 영역이 아니라 의지의 문제라고 생각하기 때문이다. 그런데 내 경험상 그렇지 않다. 치열하다는 것을 자칫 시간과의 싸움이라고만 생각하기 쉽지만, (물론 시간도 많이 들지만) 내 생각에는 오히려 다양한 관점에서 생각할 수 있는지가 관건이다.
데이터 분석을 어려워하는 사람에게 “좀 더 많이 고민해 봐라”, “다시 생각해 봐라”, 혹은 심지어 “생각을 많이 할 줄 알아야 한다”라고만 강조하는 때가 있다. 데이터 분석에서 ‘생각’은 명상을 통해 얻게 되는 깨달음이 아니다. 오랜 시간 자리에 앉아 눈을 감고 생각한다고 해서 번뜩 아이디어가 떠오를 리 만무하다.
데이터 분석에서 깨달음을 얻으려면 명상이 아닌 배경지식이 필요하다. 배경지식이라고 하면 해당 산업에 대한 트렌드 정도로만 이해하기 쉽지만, 데이터 분석 결과들이 어떤 내용을 이야기하고 있는지, 즉 ‘결과의 종류’에 대한 배경지식이 필요하다.
예를 들면, 영화 평가에 기반이 되는 ‘결과의 종류’ 중 하나가 ‘장르’다. 스펙타클한 액션을 기대했는데 2시간 중 고작 10분만 액션이 담겨 있다면 실망한다. 우리 안에 ‘액션 영화’에 대한 나름의 축적된 기준이 있기 때문이다. 그리고 그 기준은 수십 편, 수백 편 영화를 보며 만들어진 것이다.
데이터를 분석할 때도 이런 ‘장르’를 다양하게 알고 있어야 치열하게 생각할 수 있다. 내가 주로 분석하는 소비자 데이터에서의 ‘장르’는 크게 잡아 시장, 경쟁, 타깃 등으로 구분된다. 아주 요약하면 ‘시장’은 성장세를 보는 것이고, ‘경쟁’은 고민의 출처를 보는 것이고, ‘타깃’은 소비자를 보는 것이다.
여기까지는 굳이 데이터 분석 업무를 하지 않더라도 이미 많이 알 텐데, 한 단계만 더 들어가면 머리가 복잡해질 수도 있다. 단순히 시장의 성장세를 판단하는 것을 넘어서 촘촘한 증감 변화를 확대한 뒤 소비 패턴을 파악한다든가, 성장의 기반이 필요에 따른 것인지, 호기심에 따른 것인지, 대중적 편승에 따른 일시적 현상인지 등을 구분해야 한다면? 분석은 고사하고 과제를 정의하기 어려운 사람도 많을 것이다.
왜 어려울까? 당연한 얘기지만 이유는 세 가지다. 1. 위에 열거한 관점들을 들어본 적조차 없기 때문이다. 2. 어떻게 분석해야 저런 다양한 결과를 얻을 수 있는지 모르기 때문이다. 3. 지금 분석한 결과가 저런 내용 중 어디에 해당하는지 모르기 때문이다. 그리고 세 가지 중 가장 중요한 것은, 1번이다.
가장 먼저 내가 가진 데이터나 분석한 결과가 어느 장르에 해당하는지 알아야 하고, 장르를 구성하는 다양한 요소 중 어떤 특징을 주로 담고 있는지 읽어야 한다.
영화로 다시 예를 들면, 스릴러, 멜로, 드라마, 액션 등 장르의 종류를 먼저 알고 있어야 하고, 이중 ‘스릴러 같다!’고 판단이 들면, 액션 스릴러에 가까운지, 누아르에 가까운지, 추리에 가까운지, 공포에 가까운지를 정의 내릴 수 있어야 한다는 의미다.
이쯤 되면 데이터를 다 분석해 본 것도 아닌데 어떻게 장르를 정의할 수 있느냐고 물어볼 수 있을 것 같은데 영화 볼 때처럼 하면 된다. 처음 볼 때는 스릴러였는데 가면 갈수록 액션 영화 같다는 생각을 해도 된다. 그 역시 영화를 집중해서 보고 있다는 증거니까. 이게 데이터 분석의 배경지식이다.
결국 치열하게 생각한다는 것은, 지금보다 더 많은 시간을 생각해보라는 의미가 아니라, “다양한 관점을 대입해서 생각해 보자”라는 의미여야 한다. 나는 관점을 늘리는 과정을 서랍장에 비유한다. 똑같이 1미터의 서랍장들이 있다고 해보자. 1단 서랍장이라면 한군데 티셔츠와 바지와 속옷을 함께 넣어야 한다. 당연히 뒤죽박죽될 수밖에 없다. 그런데 3단이라면 어떨까. 바지를 더 사야 할지 셔츠를 더 사야 할지 속옷을 더 사야 할지 한눈에 보일 것이다.
우리가 처음 어떤 일을 하게 되었을 때 갖게 되는 서랍장은 높이 1미터의 1단짜리다. 시간이 지나면서 이 같은 높이의 서랍장은 3단, 5단으로 분리된다. 그러다 10단이 되면 그제야 비로소 서랍장의 높이가 10센티미터 정도 늘어난다. 지금 분석하고 있는 데이터가 너무 뻔하다면, 혹은 더는 무엇을 어떻게 해야 할지 모르겠다면, 아직 서랍장이 많지 않기 때문일 수도 있다.
서랍장을 늘리는 방법은 여러 가지가 있지만, 내 경우에는 데이터를 기반으로 설계된 마케팅 이론을 공부했던 게 많은 도움이 되었다. 물론 내가 줄곧 소비자 관련 데이터를 다루고 있기 때문이기도 하지만, 마케팅만큼 데이터 분석 역사가 길면서 연구된 내용을 알기 쉽게 잘 포장하는 곳도 없는 것 같다. 아마 관련 없는 분야에서 일하더라도 데이터를 새롭게 보는 관점을 간접적으로 경험할 수 있을 것이다.
마지막으로, 치열한 경험은 억지로 만들 필요가 있다. 아무리 치열하게 생각하는 ‘방법’이 있다고 하더라도 치열하게 생각하는 시간이 필요하고, 치열해 본 경험이 필요하다. 치열하다는 것은 상대적이고, 얼마만큼 해야 치열한 것인지는 본인만 알 수 있기 때문이다.
박경하 엠포스 빅데이터실 실장
출처 : 매드타임스(MADTimes)(http://www.madtimes.org)
첫댓글 아유. 길어서. 눈탱이 밤땡이 되뿌린다 요새 뭐 길게 쓰어유. 핵심만. 적어줘유. ㅎㅎㅎㅎㅎ