“화재 전혀 예상 못했다”는 카카오… 특정 1곳에만 서버 집중
[멈춰선 ‘카톡 공화국’]
데이터센터 서버 4곳에 뒀지만 카톡 등 중요 서비스 서버 판교 몰려
사고때 대체할 ‘이중화 조치’ 미흡… 예비서버 연결도 늦어 복구 지연
같은 곳 이용 네이버는 복구 빨라… 자체 데이터센터 지어 위험 분산
15일 오후 경기 성남시 분당구 SK C&C 판교데이터센터 화재 현장에 출동한 소방대원들. 이 건물 지하 3층 전기실에서 화재가 발생하면서 건물에 있는 서버를 임차해 사용하던 카카오 서비스 상당수가 마비됐고, 많은 국민이 불편을 겪었다. 성남=뉴스1
“재난 대비를 한다면서 화재 위험을 고려하지 않았다는 게 이해가 되지 않는다.” 네트워크 설비와 체계에 밝은 정보기술(IT) 업계 관계자는 카카오 측이 데이터센터 화재에 대해 ‘이례적 상황’이라고 설명한 데 대해 이렇게 반문했다. 카카오의 재난복구(DR·Disaster Recovery) 준비가 기본도 되지 않았다는 비판이 나오는 이유다.
○ “화재 시나리오 예상 못 해”
일반적으로 IT 기업은 디지털 서비스가 재난재해 상황에서도 큰 문제 없이 이어질 수 있도록 국내외 여러 지역 데이터센터에 서버를 둔다. 카카오도 15일 오후 화재가 발생한 SK C&C 판교데이터센터와 경기 안양시 등 국내 4개 지역에 위치한 데이터센터 서버 시설을 임차해 사용하고 있다.
문제는 카카오가 SK C&C 데이터센터에서만 3만2000대의 서버를 운용했다는 것이다. 판교 한 곳에 지나치게 많은 서버 시설을 배치하고 카카오톡, 카카오T 등 중요 서비스를 집중하다 보니 서버 이중화 조치의 실효성을 떨어뜨렸다는 지적이 나온다. 예비 서버로 연결하는 작업도 제대로 이뤄지지 않았다. 이러다 보니 20분 안에 복구한다는 내부 원칙과는 달리 임시 복구까지 10시간 넘게 걸렸다.
재난 대응이 미흡했던 이유에 대한 카카오의 설명도 이해가 가지 않는다는 지적이 나온다. 양현서 카카오 대외협력 부사장은 “이렇게 대규모로 서버가 전부 멈추는 것은 IT 업계에서 유례를 찾기 어려운 상황”이라며 “저희가 예상한 위험 대응 시나리오가 있었지만 화재는 워낙 예상을 못 해서 대비책이 부족했다”고 말했다. 불과 4년 전 서울과 경기 지역에서 대규모 통신 장애를 일으킨 KT의 서울 아현지사 화재 사고가 발생한 것을 생각하면 납득하기 힘든 설명이다.
문제가 반복적으로 발생하는데도 근본적 대책 마련이 미흡했다는 비판도 있다. 이달 4일 카카오톡 PC 버전이 18분간 장애를 일으키는 등 이번 화재 전에도 올해만 5차례 카카오 서비스에서 장애가 발생했다.
○ 한발 늦은 인프라 투자
네이버 역시 이번 화재가 발생한 같은 데이터센터를 이용했지만 상대적으로 피해가 크지 않았다는 점도 카카오로서는 뼈아픈 부분이다. 업계에서는 자체 데이터센터 건립 등의 투자에서 카카오가 네이버에 비해 한발 늦었다고 지적한다.
네이버는 강원 춘천시에 대규모 서버 시설을 갖춘 데이터센터 ‘각’을 지어 2013년부터 운영했다. 또 여러 지역의 서버 시설을 임차해 예비용으로 활용하면서 세종시에 2번째 데이터센터 ‘각 세종’을 짓고 있다.
홍진배 과학기술정보통신부 네트워크실장은 “네이버는 (예비 서버로 연결하는) 이중화 조치를 완료해 모든 서비스가 정상적으로 작동하는 것으로 파악하고 있다”고 말했다.
반면 카카오는 직접 보유한 데이터센터가 없다. 4000억 원을 투자한 경기 안산시 데이터센터는 내년 준공이 목표다. 대형 시스템통합(SI) 업체 관계자는 “카카오가 우리 사회에 미치는 영향력을 고려하면 뒤늦게 투자 결정이 이뤄진 것”이라며 “카카오 ‘문어발’이라는 말이 나올 정도로 사업 확장과 기업 가치 확대에만 신경을 쓰고 기본은 소홀히 한 결과”라고 지적했다.
한편 카카오는 홍은택 각자대표가 총괄하는 비상대책위원회를 출범시켜 조사, 재난 대응, 보상 대책 등을 추진하기로 했다. 다음 주에 피해를 신고할 수 있는 채널을 마련해 신고 접수를 시작할 예정이다.
지민구 기자, 성남=전남혁 기자