입구 하나 막히자 다 막혔다…실력 뽀록난 ‘수퍼 앱 카카오’
카카오톡 하나로 장벽 없고 끊김 없는(seamless) 서비스를 주더니, 장애도 아무 장벽 없이 밀려왔다.
15일 오후 데이터센터 화재 이후 드러난 ‘수퍼 앱’의 이면이다. 카카오톡은 데이터센터 전원이 차단되자 11시간 동안 완전히 먹통 상태였다. 16일 오후까지도 카카오톡을 비롯한 카카오의 주요 서비스 기능은 완전히 복구되지 않았다. 카카오톡을 기반으로 금융·결제·모빌리티·엔터·쇼핑·게임까지, 디지털 플랫폼의 확장성을 거침없이 누린 카카오. 그런데 그 수퍼 앱은 몸집만큼이나 실력도 ‘수퍼’인가? 이번 사건이 카카오에 던진 아픈 질문 셋을 살펴본다.
① 수퍼ID, 수퍼 장애를 부른다?
막대한 서버 비용이 드는 ‘전 국민 무료 메신저’ 카카오톡은 카카오의 돈 먹는 하마였다. 그러다 카카오톡에 게임을 연동한 2012년부터 회사는 흑자 전환했고, 카톡에 선물하기·이모티콘·채널 같은 수익모델을 붙여갔다. 이후 인수합병 등으로 영역을 확장해 현재 계열사는 136개다. 4750만 명(2분기 월 활성사용자 수)이 쓰는, 국민 ID나 다름없는 카카오 계정(ID)과 카톡 기능은 대부분의 서비스에 활용된다. ‘카카오 계정 로그인’은 이용자에겐 가입 편의성을, 회사엔 이용자 데이터를 통합 활용할 기회를 줬다. 김범수 카카오 창업자가 “이제는 IT를 넘어선 DT(데이터 기술) 시대”라고 말한 대로다.
지난해 국회 과학기술정보방송통신위원회 국정감사에 출석한 김범수 카카오 창업자. 임현동 기자
지난 15일 카카오톡·카카오T·카카오페이·카카오게임·멜론 앱 먹통은 그 뒷면이다. 입구(로그인) 하나만 들어가면 되니 편했는데, 그 입구가 막히니 모든 것이 막혔다. 별도 데이터센터를 사용하는 계열사도 장애를 피해 갈 수 없었다. 카카오게임즈는 게임 서버가 따로 있지만, 로그인 서버가 카카오톡인 탓에 게임 접속이 막혔다. 은행이라 데이터센터를 따로 둔 카카오뱅크마저 여파에서 자유롭지 않았다. 15일 오후 카카오뱅크 로그인과 모임통장 친구 초대, 카카오톡 간편이체 등 일부 기능에 1시간가량 오류가 발생했다. 카카오톡을 이용한 기능들로, 기존 은행 대비 카뱅의 강점으로 꼽히던 기능들이다.
시스템 이중화했다는 카카오…업계선 “사실상 안한 것”
15일 오후 3시19분 SK C&C 판교데이터센터에서 발생한 화제로 카카오의 서비스 장애가 계속 이어지고 있다. 4743만 명의 이용자가 이틀째 불편을 겪고 있다. 16일 오전 2시부터 데이터센터 전원이 공급되면서 카톡의 일부 기능을 비롯해 서비스들이 복구되고 있지만, 속도가 더디다. 이날 낮 12시 양현서 카카오 부사장은 판교 SK C&C에서 열린 미디어 브리핑에서 “여기에 있는 3만2000대의 서버 중 1만2000대가 복구됐다”며 “이중화 조치를 했음에도 불구하고 전원 공급이 차단된 상황이어서 서버를 증설해 트래픽을 전환하는 데 시간이 오래 걸리고 있다”고 말했다. 카카오는 줄곧 “시스템은 이중화(데이터 등을 다른 곳에 복제해 두는 것)돼 있고, 즉시 조치를 시작했다”고 해명했다. 데이터는 총 4개의 데이터센터에 분산 저장돼 있고, 시스템도 이중화돼 있기 때문에 데이터 손실 위험은 ‘제로(0)’라고 주장한다. 양 부사장은 “화재 때문에 직접 진입해 시스템을 수리하는 데 물리적 한계가 있었다”고 말했다. 즉 이중화를 하긴 했지만, 판교 데이터센터에 접근이 차단돼 이중화 속도가 더뎠다는 설명이다. 그러나 업계에선 “그건 이중화가 아니다”고 지적한다.
정보기술(IT) 업계에선 카카오가 판교 한 곳에만 메인 시스템을 몰아놓고, 이중화를 부분적으로만 해 사실상 안 한 것이나 마찬가지라는 의구심이 나오고 있다. 메인 시스템을 여러 데이터센터에 고르게 구축하지 않아 판교에서 장애가 발생했을 때 속수무책일 수밖에 없었다는 추정이다. 과기정통부 관계자는 “이중화에 대한 기술 기준이 없기 때문에 이중화 여부를 무 자르듯 구분하긴 어렵지만 카카오의 경우 통상적 의미에서 이중화가 됐다고 보긴 어렵다”고 말했다.
카카오와 네이버의 대응 차이를 가른 것도 결국 이중화였다. 사고가 발생한 판교 데이터센터에 네이버도 적지 않은 서버를 두고 있으나 카카오 수준으로 서비스 먹통 상태까지 가지 않았다. 김승주 고려대 정보보호대학원 교수는 “이중화를 했느냐 안 했느냐의 문제가 아니라 어느 정도로 했는지가 중요하다”며 “예를 들어 컴퓨터 하드에 100개의 파일이 있는데 외장 하드에는 주요 파일 5개만 넣어 놓으면 이중화율은 5%에 불과해, 사실상 이중화 조치는 안 된 것으로 봐야 한다”고 지적했다.
비상 재해복구(Disaster Recovery·DR) 시스템이 제대로 작동하지 않았다는 비판도 나온다. DR은 데이터 보유 정도에 따라 ‘미러사이트’ ‘핫사이트’ ‘웜사이트’ ‘콜드사이트’로 나뉜다. 원본을 그대로 복제하는 미러사이트는 주 사이트와 동일한 시스템을 하나 더 설치해 운영하는 것이고, 핫사이트는 미러사이트까지는 아니어도 주 사이트에 버금가는 설비와 자원을 구축한 곳이다. 핫사이트만 구축했어도 수 시간 내 주 사이트를 복구할 수 있다. 보안 업계 관계자는 “과거 여러 사고로 DR과 데이터 이원화는 필수라는 인식이 생겼는데, 문제는 비용”이라며 “카카오는 다른 데이터센터에 판교를 보충할 만한 리소스를 제대로 배치하지 않은 것 같다”고 말했다.
한편, 카카오 측은 “16일 오후 9시30분 현재, 카카오톡 및 카카오 서비스의 주요 기능들은 상당 부분 정상화 되고 있다”며 “서비스가 완전 정상화될 때까지 최선을 다해 개선해 나가겠다”고 밝혔다. 다만, 톡채널과 톡서랍 등은 여전히 복구 중이라고 덧붙였다.