이번 독서마라톤의 코스는 빅데이터, 경영을 바꾸다이다. 이 책은 삼성경제연구소에서 쓴 책인데, 앞으로 대세
로써 인식되는 빅데이터가 앞으로 우리 사회를 어떻게 바꿀 것이고, 빅데이터를 활용하기 위해서 어떤 것이
필요한지에 대해서 쓴 책이다. 빅데이터는 2012년 세계경제포럼에서 국제 개발의 새로운 기술 중 하나로 지목
됬다. 빅데이터는 단순히 큰 데이터가 아니다. 빅데이터는 대용량데이터로부터 필요한 정보를 얻어내는 기술
이다. 더 자세히 알아보기 위해 월마트의 사례를 든다. 어느 날 고등학생인 딸이 출산용품 광고 메일을 받자
한 남자가 매장을 찾아가 강하게 항의한다. 마트에서는 마케팅팀의 실수라 여겨 사과하지만, 얼마 후 딸이
임신 사실을 숨겨온 것이었다. 이렇게 빅데이터는 월마트에서 고객의 구매 이력을 분석해 임산부의 특이 패턴
을 찾아내는 예측 모형을 통해 광고 메일을 보낸 것이었다. 따라서 빅데이터는 단지 정보가 많은 것으로는
부족하다. 많은 정보를 걸러내어 필요한 정보를 뽑아내는 것이 빅데이터인 것이다. 따라서 빅데이터는 3V로
불리는 특성을 지녀야 한다. 규모(Volume), 다양성(Variety), 속도(Velocity)이다. 먼저 규모로써 빅데이터는
어마어마핟. 구글에서 매일 처리하는 데이터의 양은 240억 메가바이트나 되기 때문이다. 또한 단순히 규모로
빅데이터라고 할 수 없는 이유는 오늘날의 데이터들은 매우 다양하기 때문이다. 앞선 월마트의 사례처럼 마트
의 모든 물품을 누가 사가는 지를 바탕으로 예측 모형을 짜는 것처럼 수억개의 물품을 수억명의 사람들이 사는
것을 통계화 해야하기 때문이다. 또한 빅데이터가 속도를 필요로 하는 이유는 과거 초당 300바이트에 불과하던
데이터 전송 속도가 오늘날 100메가바이트로 10만배나 빨라졌기 때문이다. 동시에 정보의 전달또한 10만배나
빨라져 빅 데이터는 모든 데이터를 통계화 해야 하므로 그 많은 양을 올라오는 속도보다 빠르게 처리해야 하기
때문이다. 예전에는 TV나 신문에 먼저 나와야 알 수 있는 정보들이 오늘날 방송이 되기도 전에 이미 모두가
사건이 터진 것을 알아내기도 하기 때문이다. 그렇기에 이젠 기업들이 새로운 의사결정을 하려면 예전에는 몇
주까지도 걸리던 것이 이젠 분다위로 단축되었다. 그만큼 민첩한 감지와 대응이 필수적 요소가 된 것이다.
그렇기에 과거 빅데이터는 기존의 방식으로 거대한 크기를 갖는 비정형 데이터를 관리, 분석하기 매우 어려운
데이터에서 현재 관리와 분석이 매우 어려운 데이터 + 필요한 인력과 조직 및 관련기술까지 포괄하는 용어로
바뀌어 가고 있다. 정의를 알았으니 빅데이터의 유용성을 알아볼 차례이다. 빅데이터의 규모 측면의 유용성은
가장 먼저 정보의 왜곡을 줄일 수 있다. 일반적인 표본 추출은 표본이 편향되게 이루어 질 경우 왜곡될 위험이
매우 높다. 하지만 빅데이터는 이러한 왜곡의 가능성이 없어진다. 그렇다면 다양성 측면의 유용성은 무엇일까
다양성 측면의 유용성은 정형화된 데이터뿐만 아니라 비정형화된 데이터에서도 정보를 얻어낼 수 있게 되었다
는 것이다. 또한 속도 측면의 유용성은 빅데이터를 통해 발 빠른 대처가 가능해졌다는 것이다. 과거 정형화된
데이터를 토대로 표본추출을 하여 데이터베이스를 통해 정보를 뽑아낼 때에는 데이터를 정형화하는 시간이
걸렸다면 이젠 그 시간이 사라져 민첩한 대응이 가능해졌기 때문이다. 이러한 빅데이터가 이슈로 떠오른 이유
는 몇 가지가 있다. 첫째는 저장 매체의 발달이다. 과거 아날로그 데이터만이 저장가능하던 시대에서 각 가정
마다 인터넷이 되는 컴퓨터를 탑재한 이후 데이터의 양은 기하급수적으로 늘어났다. 또한 둘째로는 사람과
사람, 기계와 기계의 연결이 증가했다는 것이다. PC보급이 원활화 되면서 서로서로 온라인 상에서 대화가
활발히 이루어졌기 때문이다. 또한 현대에는 급격하게 진보하고있는 데이터 관리와 분석기술도 한몫을 하고
있다. 또한 기술적 환경뿐만 아니라 시장 환경과도 딱 맞아 떨어지고 있다. 인터넷 혁명 이후로 숨가쁘게 진보
하고 있는 IT업계에서는 경쟁이 어마어마하게 일어나고 있다. 과거 부자는 망해도 3년은 간다고 했으나 이젠
망하면 그대로 추락해버리는 시대가 왔다. 그렇기에 속도의 중요성이 증대됬고, 그 배경을 통하여 빅데이터가
이슈로써 떠오르고 있는 것이다. 또한 빅데이터는 특성상 범용품화가 되기 어렵다. 그렇기에 복제나 모방이
어려워 기업에서 특히 선호하고 있는 것이다. 최근 페이스북에서는 자신들의 소프트웨어와 하드웨어를 공개하
기도 했다 이는 다른 기업들이 이를 모방해도 빅데이터는 절대로 모방할 수 없을 것이라는 계산이 들어섰기
때문이다. 빅 데이터는 기업들에게 새로운 차원의 생산성 향상을 불러일으킬 것이다. 물론 기업이 혁신적인
첨단 제품으로 경쟁자를 압도할 수도 있지만, 대부분의 기업들은 경쟁자들과의 피 말리는 비용 절감 싸움을
하고 있다. 이런 상황에서 빅데이터를 통하여 비효율적인 것은 삭제하고, 효율적인 것을 추가하여 생산성에서
능률적 상황을 만드는 것은 기업들의 생산력을 극대화 할 것이다. 예를 들어 실물 움직임을 포착하는 센서를
통하여 동선을 가장 효율적으로 짜는 방식으로 생산성을 극대화 시킬 수도 있다. 그리고 모두가 생각하지 못한
새로운 발견을 통하여 문제를 해결할 수도 있다. 아서 사례로 든 것과 같이 보통의 경우라면 고등학생에게
절대로 출산용품을 광고하지 않을 테지만, 빅데이터는 통계를 통하여 출산용품을 광고한 것과 마찬가지다.
기업들은 빅데이터를 통해 자사의 상품과 관련된 SNS로 어떤 부분을 마케팅할 지를 알아낸다. 특히 빅데이터가
과거 데이터베이스와 다른 점은 상호작용 데이터라는 것이다. 빅데이터는 비구조적인(단순한SNS에서의 사람들
대화)와 실시간 데이터를 수집하여 분석 및 활용하기 때문이다. 이를 통해 과거 고객이 문제를 제기하기 전에
사전에 감지하여 이를 방지하기도 한다. 즉 예측이 가능해지는 시대가 온 것이다. 또한 개개인에게 맞춤화
서비스를 제공하는데 앞장 설 수 있게 됬다. 개개인의 비정형화된 특징에 맞춰나갈 수 있는 시대가 오게 된
것이다. 그리고 빅데이터는 의사결정의 과학화와 자동화를 이끈다. 과거에는 편견이 의사결정의 독약이 되곤
했다. 비정형화된 자료 때문에 항상 기업들은 골머리를 앓았기 때문이다. 하지만 빅데이터를 통하여 비정형화
된 자료또한 전부 살펴볼 수 있게 되고, 불확실성을 줄어들게 만들어 준 것이다. 의사결정에 빅데이터의 통찰
력을 활용하는 것은 4단계로 나뉜다. 첫 번째로 어떤 일이 발생했는지를 파악하는 것이다. 둘째로 첫째 단계를
통하여 어떤 부분이 문제인지를 구체적으로 파악하는 것이다. 셋째는 무엇이 발생할지 예측하는 것이다. 넷째
는 문제에 대한 최적의 해법을 찾아내는 것이다. 빅데이터는 이 과정을 가장 민첩하게 대응할 수 있는 능력을
지닌다. 시험시장으로써 적합한 것이다. 한국 소비자들은 대부분이 얼리어답터로써 높은 기술 수용성을 가지고
유별난 깐깐한 특징을 지닌다. 그렇기에 빅데이터같이 민첩한 대응과 개개인들에게 맞춤형 서비스를 지니는
특징을 지닌 것은 활용도가 매우 높아지는 것이다. 빅데이터를 가장 선진적으로 발전시킨 기업으로는 구글과
아마존이 있다. 구글은 밋밋한 디자인을 지녔음에도 전세계에서 심지어 한국에서도 대표적인 검색 소스로써
이용된다. 간단한 정보는 네이버 등을 통해 찾더라도, 상세하고 지엽적인 정보는 구글에서 찾는 것을 쉽게
접할 것이다. 그리고 아마존은 처음에는 단순히 서점을 온라인으로 옮겨놓았지만, 후에 사용자들의 구매 이력
을 통하여 각 고객들의 특성을 파악해 추천 도서를 띄어주고, 평점과 후기서비스를 통하여 빅데이터를 접목
시켰다. 그 결과 현재 전 세계적인 온라인 장터로써 발전하여 한국시장까지 넓혀나가게 되었다. 그러나 한국의
기업들은 단지 정형화된 데이터베이스를 토대로 개개인에게 맞춤형 서비스가 아닌 개개인을 자신들이 만든
카테고리에 넣어 분류하여 카테고리에 맞는 맞춤형 서비스를 제공한다. 짜잘한 데이터는 데이터 취급을 안하여
빅데이터를 지닌 기업들에 밀리고 있는 특징을 보이기도 한다. 물론 빅데이터의 미래가 항상 장밋빛인 것은
아니다. 빅데이터도 여러 가지 문제점을 지니고 있다. 첫째로 개인정보보호문제이다. 빅데이터를 통하여
데이터의 이용 범위가 비약적으로 넓어지면서 어디까지가 개인정보고 어디까지가 사용 가능한 정보인지에 대한
선이 정해지지 않았다는 것이다. 맞춤화 서비스가 정교해짐에 따라 사람들은 ‘어떻게 나에 관해 이런 사실
까지 알고 있는 거지!‘라며 사생활 침해를 주장할 수도 있기 때문이다. 둘째로 데이터 남용 문제도 있다.
빅데이터를 너무 신용하게 되면 확률적 상황을 확실한 것으로 믿어 상황을 잘못된 방향으로 몰고 갈 수도 있다
는 것이다. 또한 SNS상의 다양한 글들을 수집하여 분석한 것에 과연 지적 재산권이 누구에게 있나에 대한 법적
공방이 있을 수도 있다. 아직 우리나라에서는 법 제도가 명확하게 선이 그어지지 않았기 때문에 사용에 대한
논란이 끊임없이 이어질 수도 있다. 이렇게 이 책은 빅데이터에 대하여 정의를 내리고 빅데이터의 장점과 단점
또한 빅데이터가 앞으로 쓰이기 위해서는 어떻게 이루어져야 되는 지에 대해서 설명을 한다. 물론 이 책은
주로 기업 경영자들을 주 타겟으로 쓰여진 책이기에 일반인들에게 다소 거리감이 느껴질만한 책이라고도 생각
된다. 하지만 현대의 트렌드를 읽고 빅데이터가 앞으로 어떻게 쓰일 것인지를 인식하는 것은 기업 경영인뿐만
아니라 일반인에게도 중요한 것이기도 하다. 나는 컴퓨터공학을 전공함으로써 데이터관련 일을 주로 하고 싶기
에 이 책을 처음 접하게 되었다. 데이터 관련 기술이란 어느 곳에서나 가장 중요한 정보로써 쓰이는 대표적인
기술이다. 어느 기어이나 마케팅과 기술 개발은 꼭 필요한 일이다. 그러한 마케팅과 기술 개발 모두에 쓰이는
것이 바로 데이터 관련 기술이기 때문이다. 그렇기에 요즈음 데이터베이스가 빅데이터 추세로 바뀌는 것에 대
해 관심을 가지고 이 책을 접근하게 되었다. 본래 사회에서 빅데이터가 앞으로 기업들이 정보를 활용하는데
가장 주된 기술로써 사용된다고만 들었지 빅데이터가 정확하게 어떤 것인지 어떤 방식으로 쓰이는지에 대해서
는 알고있는 정보가 하나도 없었다. 하지만 이 책을 통하여 빅데이터가 어떤 것인지 어떤 방식으로 쓰이는지에
대해서 어느정도 감을 잡게 되었다. 가장 먼저 빅데이터는 각종 데이터베이스들을 통합체라고도 볼 수 있을 것
같다. 데이터베이스는 데이터들을 분류화해 모아두는 것이다. 빅데이터는 그 데이터들을 분류한 것을 통하여
가장 효과적으로 맞춤형 서비스를 제공하는데 그 의의가 있다고 본다. 인터넷이 엄청난 속도로 개개인들에게
보급화됨에 따라 현재 어마어마한 데이터를 제공하게 되었다. 하지만 그 데이터들을 전부 분석 및 활용하는 것
은 데이터베이스만으로는 불가능에 가까웠다. 하지만 빅데이터를 통하여 클라우드 서비스를 기반으로 부족한
저장용량을 극복하고 그것을 분석하는 것이 가능해지게 만든 것이다. 클라우드 서비스란 말 그대로 우리가
아는 것처럼 정보들을 하드에 저장하여 보관하는 것이 아닌 구름처럼 우리가 가진 하드가 아닌 인터넷 상에
저장하는 것이다. 그렇기에 저장 용량이 의미가 사라지게 되는 것이다. 이러한 기술 개발이 막대한 양의 데이
터를 활용가능해지게 만든 것이다. 처음 컴퓨터공학과에 오게 되었을 때에는 프로그래밍에 관심이 있었다.
하지만 생각을 해보니 프로그래밍된 프로그램을 뺏고 지키는 것에 뭔가 더 매력을 느끼게 되었다. 즉 컴퓨터
보안에 대해서 관심을 가지게 된 것이다. 그래서 심심풀이로 카페같은 데서 와이파이를 해킹하여 남의 컴퓨터
를 강제로 종료하기도 화면을 훔쳐보기도 해봤다. 하지만 이것은 알아야 할 것들이 너무나도 많기도 하고 선이
너무나도 불분명하여 인생이 외줄타기와 가까워 질수도 있다는 느낌을 강하게 받았다. 그렇기에 데이터 관리
기술에 가장 관심을 집중하게 되었다. 데이터 관리 기술은 프로그래머들에게 프로그래밍에 필요한 도안을 제공
하는 즉 프로그래밍을 건설업에 비유한다면 도안을 제공하는 건축학과가 되고싶은 것이지 도안을 보고 건물을
짓는 사람이 되고싶은 마음은 별로 없었기에 데이터 관리 기술에 더욱 관심이 가게 되었다. 그렇기에 데이터
베이스에 관심을 갖고 공부를 시작하려던 찰나 빅데이터가 새로운 이슈로 떠오르게 되었고 빅데이터에 대하여
관심을 갖게 되었다. 언젠가 학교 동아리에 졸업한 선배가 와서 빅데이터를 알려주고 간단한 세미나 같은 것을
개최한 적이 있었다. 나는 그것에 관심을 가지고 있었는데 마침 병영도서관에 빅데이터에 대한 책이 있기에
읽어보게 되었다. 내용은 내가 생각하던 것 그 이상이였다. 데이터 관리 기술은 원래 마케팅과 기술 개발을
돕는 기술로써만 생각하고 있었는데 사실 그러한 것들을 뒤에서 서포트 해주는 것 자체가 기업을 경영하는 것
이 된다는 것을 깨닫게 된 것이다. 즉 데이터 관리 기술이 곧 기업을 경영하는 것이 된 것이다. 앞으로 시대는
더욱 그러한 추세로 변형하게 될 것이라는 점에 더욱 관심이 집중되었다. 그러나 이 책을 읽으면서 한가지
의문점이 생기기도 하였다. 아직 법 제도가 마련되지 않아서 빅데이터 관련 기술을 기업들에 접목하기에는
여러 가지 문제점이 많다고 한다. 그렇다면 내가 사회에 나가게 되어 데이터 관련 기술에 대한 일을 하기 시작
할 때쯤에는 과연 어느정도의 선이 생기고 그에 따라 법 제도가 마련되어 더욱더 정형화된 빅데이터를 활용할
수 있게 될지이다. 그렇게 된다면 더욱더 빅데이터에 대한 기업들의 관심도도 높아지고 대표적인 사회적 트렌
드로써 자리잡을 수도 있게 될거라 생각되기 때문이다. 생각해보면 빅데이터라는 것은 요즈음에 생겨난 것이
아닌 항상 사람들이 추구한 것이라는 것을 쉽게 알 수 있다. 가장 먼저 기업들은 원래부터 자신의 소비자들에
게 가장 합당한 서비스를 제공하여 그들을 자신들의 소비자로 매혹하는 것이 각 기업들의 주된 마케팅 기법
이었다. 단지 그것이 현재에 와서 기술적으로 기반이 마련된 것이다. 즉 빅데이터는 본래부터 필요로 된 기술
이었지만 이제와서야 개발이 된 것일 뿐이다. 한때 데이터베이스가 모든 기업의 핵심 요소로 자리잡은 것처럼
빅데이터또한 얼마지나지 않아 그렇게 될 것이라 생각한다. 하지만 빅데이터는 앞어 말했다시피 모방이 거의
불가능하기에 새롭게 접근하기가 매우 어렵다. 이를 관리할 사람도 새로 채용해야 하기에 비용도 무시못할
정도로 들 것이기 때문이다. 즉 빅데이터가 어떻게보면 기업들간의 빈부격차를 더욱 극대화 시킬 것 같다는
생각도 든다. 빅데이터를 제대로 활용하여 접목하는 기업들은 소비자들을 더욱더 끌어들이는데 성공할 것이고
반대로 빅데이터를 활용할 인력조차 고용하지 못하는 기업들은 점점더 소비자들을 잃게 될 것이기 때문이다.
언젠가 어떤 영화에서 그런 장면을 본 적이 있다. 기업들이 세계를 좌지우지 하는 세상이 오게 될 수도 있다고
어떻게 보면 기술이 개발함에 따라 미래에는 그러한 현실이 다가올 수도 있다는 생각이 빅데이터를 보면서 들
기도 한다. 하지만 빅데이터는 기업들이 정보를 수집하는 마지막 종착점으로써 꼭 필요한 기술이라는 생각도
들기에 더욱 관심이 가는 분야이기도 하다.