“x86서버 가상화와 클라우드 환경에서 SAP ERP를 운영하는데 전혀 문제없다. 7월 전면 가동 후 3번의 월 마감을 돌리면서 하드웨어로 인한 성능 문제는 단 한번도 겪지 않았다.”
지난 7월 1일 한국의 첫번째 x86서버 기반 SAP ERP 시스템이 세상에 모습을 드러냈다. KT의 ERP는 세계 통신사 중 최대 규모. 고가의 유닉스 서버만 미션크리티컬 애플리케이션을 감당할 수 있다고 여겨온 국내 IT담당자들에게 날린 한방이다.
시스템 정식 가동 후 3개월이 지난 시점. KT의 이제 비즈니스인포메이션시스템트렌스포메이션(BIT) 추진단장(상무)을 최근 만났다. ERP 플랫폼을 SAP 패키지 풀세트로 꾸리면서, 유닉스서버 대신 x86서버와 클라우드를 기반 인프라로 활용한 만큼 현재까지 상황이 궁금했다. 그는 “현재까지 어떤 장애도 겪지 않았다”고 단언했다.
▲ 이제 KT BIT 추진단장
■수만명이 쓰는 ERP도 x86서버로 끄떡없다
KT의 BIT ERP는 HP 프로라이언트 x86서버에 수세 리눅스, 제이보스 미들웨어, 오픈소스 젠 하이퍼바이저, 오라클VM 등을 기반플랫폼으로 구축됐다. 데이터베이스(DB) 서버의 경우 가상화를 하지 않은 x86서버를 사용하며, 대부분의 인프라가 클라우드 환경으로 운영되고 있다.
이 시스템은 직원 3만명, 외부 협력사까지 5만~6만명이 사용하는 연매출 22조원 규모의 KT를 감당한다. 월단위 매출결산만 2조원이 넘는다. 온라인트랜잭션처리(OLTP) 트래픽만 하루 3~4천만 건이다.
“7월, 8월, 9월 결산처리를 감당하면서 단 한건의 장애도 없었다. 기껏해야 애플리케이션 튜닝 쪽에서 작은 문제가 발견됐을 뿐이다. 하드웨어 성능이나 부하로 인한 걱정은 전혀 하지 않아도 된다. 트랜잭션이 늘어나면 WAS하나 더 붙이면 그만이다. x86서버 성능에 대한 우려는 부적절하다.”
KT의 ERP 시스템은 근본적으로 부하에 취약할 수 있는 구조다. 단일 SAP 패키지를 사용하기 때문이다. 이제 단장은 그럼에도 현 시스템에 문제가 없다는 점을 강조했다.
“ERP를 단일한 SAP 패키지로 결산하는 회사가 전세계에 별로 없다. SAP 패키지가 인사, 구매, 재고, 자산, 경영기획 등을 모두 포괄하게 돼 있다. 업무들이 집중되므로 부하 취약할 수 있는 구조인 것이다. 그런데도 부하로 인한 장애가 없다는 얘기다.”
KT BIT ERP는 시행 초기부터 우여곡절을 많이 겪었다. 일단 플랫폼을 리눅스로 다운사이징한다는 시도부터 반발에 부딪쳤다. 심지어 솔루션공급업체인 SAP조차 유닉스 플랫폼 사용을 권유했을 정도다. 프로젝트 진행도 계속 늦어졌다. 고난의 행군이었음은 누구도 부정할 수 없다.
“반대했던 사람들이 납득하질 못했다. 하지만 x86서버는 유닉스 서버와 성능 격차를 많이 줄였다. 중간중간 유닉스에서 돌아가던 몇몇 애플리케이션을 리눅스로 이전했는데 2004년 도입한 유닉스 장비보다 x86 장비 성능이 2~3배 높았다. 그 사이 유닉스도 성능을 높였다는 걸 감안해도 그 격차가 엄청나게 줄었다는 걸 알 수 있다.”
x86 도입을 반대하는 입장이 성능만 문제삼은 건 아니다. 안정성과 관리비용도 근거였다. KT는 이중화 구성을 통해 안정성을 확보하고, 글로벌 오픈소스 표준 기반의 클라우드 서비스 운영 노하우를 가진 내부 인력을 통해 관리문제를 해결했다.
“관리비용이 많이 든다고 하는데, 잘 생각해야 한다. 유닉스로 운영하게 되면 유연성이 떨어지고, 조금만 증설하려 해도 랙수가 늘어난다. 오픈소스와 시스템 엔지니어링에 대한 일정정도의 기술력을 자체적으로 확보한 스탭을 갖추면 된다. KT는 클라우드 분야에 투자하면서 엔지니어를 축적했기 때문에 문제가 생기면 트러블슈팅하면 그만이다. 오픈소스는 웹상에 비슷한 트러블슈팅 사례가 많다. 대부분의 소스 원작자와 논의할 수도 있다.”
■초기 구매비용절감 70%, 비즈니스 혁신 기대
가장 가시적으로 얻은 성과는 역시 비용이다. 유닉스 서버의 신규 도입 자체를 포기하고 과감히 x86서버와 오픈소스 SW로 가면서 구매비용과 5년간 총소유비용(TCO) 절감 효과는 컸다.
“BIT 프로젝트를 통한 1년 TCO 절감액이 1천억원을 넘었다. 하드웨어 구매비용이 유닉스보다 4분의 1수준이었다. 시스템 SW도 어마어마하게 줄였다. SAP를 제외한 표준 스택이 오픈소스젠과 리눅스, 레드햇 제이보스이며, DB는 포스트그레SQL를 썼다. 도입비용만 70% 이상 줄였다. 5년 단위 TCO로 하면 더 커질 것이다. 그외 전력비용, 상면 비용까지 하면 과거와 비교할 수 없게 적은 비용이다.”
오픈소스 중 일부는 엔터프라이즈급 서브스크립션 서비스를 도입했다. 이제 단장은 오픈소스와 범용 하드웨어를 사용하면서 증설에 대한 고민도 사라졌다고 덧붙였다.
“증설의 경우 대부분 가상화를 쓰니 여유 자원에 가상머신(VM) 만들어서 추가하면 그뿐이다. 고가인 DB용 서버를 증설해도 유닉스 대비 10% 비용이면 충분하다. 증설에 대한 고민이 없다. 상면측면으로 봐도 혜택이 크다. 유닉스는 1대만 사도 랙 한대가 공간을 차지했지만, 가상화로 한 랙에 20~30개의 VM을 쓰니 상면이 눈에 띄게 줄어든다.”
KT는 BIT 프로젝트를 추진하면서 비용절감에 목표를 두지 않았다. 단순한 차세대 프로젝트가 아닌 경영혁신을 위한 인프라 조성 사업의 성격이었다. 새로운 ERP와 함께 비즈니스 프로세스 혁신이 앞으로 더 큰 효과를 기대하게 한다.
“ERP의 가장 큰 목적은 회사내 모든 데이터를 스토리에 맞게 엮어 놓는 것이다. 계약, 사업기획, 예산, CRM, 결산 등 모든 프로세스를 동일한 기준의 정보로 맞추게 된다. 정보를 동일한 기준으로 맞추는 건 얼핏 당연히 들리지만 매우 어려운 일이다. 수천 수만명의 인력이 관련되고, 조직마다 기준이 다 다르다. ERP는 특정 지사의 과잉투자를 잡아내고, 실적의 겉과 속이 다른 사업을 찾아낸다. 기업 내의 관리의 투명성을 높여서, 전체적으로 경영 합리화를 가져오는, 비용최적화가 일어나는 것이다.”
■쉽지 않았던 BIT, 성공 비결은 '클라우드 투자'
여러 조직으로 분화된 KT인 만큼 저마다 달랐던 기준을 단일화하는 일이 쉽지 않았다. 근무행태를 바꾸고 문화를 바꿔야 하는 만큼 각 조직들이 얌전히 있었을 리 만무하다. 이제 단장은 BIT추진단에 강한 주도권을 부여한 경영진의 역할이 컸다고 밝혔다.
기업 경영진의 전폭적인 지원과 함께 KT의 BIT ERP가 성공적으로 오픈할 수 있었던 비결은 더 있다. 2010년의 클라우드 컴퓨팅 서비스에 대한 투자결정이었다.
“2010년말 초기버전 KT의 유클라우드가 나왔다. 그를 오픈 API 스택 용도로 써보려 했다. R&D를 1년 정도 진행하면서 다양한 조합들을 만들었다. 작년 말 1억5천만건 트래픽을 감당하는 오픈API스택을 x86 기반으로 다 만들었다. KT의 SMS, MMS, 올레닷컴 인증 등이 이 시스템에 기반한다. 지난 3월 쿡과 쇼 ID를 통합한 올레ID 뒤엔 오픈API스택이 있고, 그 뒤에 유무선 고객정보 인증 시스템이 투입됐다. x86 환경에 대한 기반이 있었다는 것이다.”
▲ KT BIT ERP
KT의 유클라우드는 오픈소스 SW와 범용 하드웨어를 사용하면서 화제를 몰고 다녔다. 시스템을 직접 구축해 서비스로 제공해본 경험이 전혀 없던 KT가 오픈소스에 도전했을 때 일각에선 코웃음을 치기도 했다. 실제로도 ‘맨땅에 헤딩’이었던 KT의 오픈소스 도전은 기술내재화란 무엇과도 바꿀 수 없는 선물을 안겼다.
“장애나 유니보수에서 트러블슈팅 시 내부의 좋은 엔지니어를 갖고 있지 않으면 해결할 수 없다. 전문가라고 해도 보편적이고 대략적인 얘기만 할 수 있다. 기업 인프라는 외부인이 컨피규레이션을 모르면 로그 분석을 못한다. 외부인이 알고 있는 지식이 패치발생 정도고, 긴급대응은 전원을 껐다켰다 하면서 상황보는 것이다. KT는 호스팅 서비스를 제공하면서 OS나 미들웨어 관리수요에 대응할 동기부여가 있었고, 클라우드에 투자하면서 가상화 인프라 운영경험을 갖게 됐다.”
클라우드 컴퓨팅 분야에 대한 꾸준한 투자로 얻은 내부 인력은 KT의 막강한 자산이 됐다. 또 프로젝트의 중요한 작업은 독일 SAP 본사와 직접 논의했고, SAP의 온사이트 서포트를 구매해 SAP 전문엔지니어를 한국과 독일을 오가게 하며 작업하도록 했다. 그리고 SAP는 KT에 클라우드 환경에서 자사의 ERP를 원활히 운영할 수 있고 대외 서비스도 가능하다는 인증을 부여했다.
KT처럼 거대한 ERP 시스템을 일거에 다운사이징한 사례는 세계적으로도 찾기 어렵다. KT의 BIT는 그래서 더 주목받는 지 모른다.
“한국은 금융권에서 반응이 와서 같이 해보자는 논의가 진행되고 있다. 또 한국보다 해외 반응이 더 크기도 했다. 올해 오라클 오픈월드에서 발표했더니 텔레포니카, 버라이즌, 도이치 텔레콤, 보다폰 관계자들이 ‘대박’이란 반응을 보였다. KT 벤치마킹 의사를 밝혔고. 글로벌 통신사업자 CIO와 컨퍼런스콜만 10차례 넘게 했다. 아태지역의 통신사는 직적 방문해 보고 가기도 했다.”
■ICT회사로 가는 여정
서비스 자체가 미션크리티컬인 통신사업은 기존 인프라를 정리하고 새로운 길로 들어서기 쉽지 않다. KT의 BIT 프로젝트는 여전히 진행중이다. ERP 외에도 모든 인프라를 x86서버와 클라우드 환경으로 바꾸는 작업은 2014년까지 이어진다.
KT는 당장 내년 가을 새로운 빌링시스템의 정식 오픈을 준비하고 있다. 이제 단장에 따르면 KT의 빌링시스템 규모는 세계 10위권에 들 정도로 대규모다. 오라클 BSS를 사용한 이 프로젝트 역시 x86 기반이다.
“BSS는 자바 스택의 아키텍처를 정교하게 만들어야 한다. 특정 트랜잭션이 전체 시스템을 죽일 수 있다. 자바 메모리 관리가 논리적으로 잘 분산되지 않으면 전체 클러스터가 주저 앉는다. 비즈니스를 잘 이해해서 설계하고 보완, 개발하는 작업이 크다. ERP보다 더 힘든 작업이다. 하지만 하드웨어는 별로 걱정하지 않는다. 테스트해보면 최고사양인 HP 프로라이언트 DL980 3대가 유닉스 3대와 같은 작업을 처리한다. 시간당 10만건 주문처리를 실험했을 때 현재 운영중인 시스템은 1만건만 몰려도 뻗지만, x86 시스템은 문제없었다.”
이제 단장은 아직 성공을 단언할 수는 없다고 했다. 갈 길이 많이 남았다는 것이다. ERP만해도 내년까지 지켜봐야 한다고 말했다.
“ERP도 아직 성공을 확신할 단계는 아니다. 오픈하고 1년은 지나야 한다. 지금은 막 만들어서 잘 되는지 보는 단계로 성공확신까지 절반 넘어선 것이라고 본다. 전체적으로 x86 환경으로 가면, TCO 절감효과도 클 뿐 아니라, 애자일하게 비즈니스 요구사항에 대응하면서, 장애 대응도 쉬워질 것이다. 내년 절감목표액은 전체 구축 금액보다 훨씬 크다.”
마지막으로 이제 단장은 BIT 프로젝트의 궁극적인 목표를 언급했다. KT 내 IT조직의 DNA에 R&D를 완전히 정착시키는 작업이다.
“KT는 통신회사지 기술회사가 아니었다. 고생하면서 많이 바뀌었지만 IT조직은 탄성이 강해 금방 원상복구된다. IT로 유전자를 바꾸는 데 10년은 걸릴 것이다. 5년동안 기반을 만들고, 또 5년 간 안정화를 거쳐 R&D 버릇이 생기면 그 땐 완전히 새로운 회사가 될 것이다.”