|
[권석준의 기술과 사회] 반도체는 모든 현재 기술을 곱하기시킨다
권석준
✔ 일반 반도체 vs AI 반도체 - 단순한 공정 제어 vs 데이터 감시 지시
✔ 한국, 산업별 축적된 데이터 풍부해 하이테크 제조업 가능
✔ 길이 170km·높이 500m 네옴시티는 엘리베이터들의 은하계
✔ 충돌 없이, 고장 없이 계속 가동될 때 네옴시티 사업 성공
이번 글은 고성능, AI 반도체가 어떻게 각 산업의 진일보를 가능하게 하는가 입증하는 데 주력하고 있다. 바이오산업의 경우 인간 유전체의 데이터를 읽어내는 속도가 노트북급에서 슈퍼컴 급으로 빨라지면 치료나 예방 기술 개발이 그만큼 빨라진다.
사우디의 네옴시티 계획은 의외로 이 도시에 설치될 수많은 엘리베이터들의 제어 기술에 성패가 달려 있으며, 소형모듈원전(SMR) 또한 대형 원전급으로 공정 제어가 가능하다면 사업 성공의 가능성을 높이게 된다. 권석준의 반도체 강의를 읽는 기분으로 읽어보시길. [편집자 주]
반도체와 커플링 되어 더욱 혁명적인 변화를 겪을 것으로 예상되는 분야는 첨단 바이오 분야다. 첨단 바이오는 2022년 과기정통부가 선정한 12대 국가전략과학기술 분야에도 포함되어 있다. 생명 현상을 다루는 분야와 반도체의 연관성을 찾는 것은 쉽게 납득되지는 않을 수 있다.
유전자 데이터 읽어내는 속도가 신약 개발의 속도
그렇지만 생물학은 왓슨과 크릭이 DNA 나선 구조를 밝혀낸 이후, 분자생물학 수준에서 다시 쓰여 왔다. 지난 70여 년 동안 바이오산업은 점점 정보 과학과의 연계가 강화되고 있는 방향으로 진화하고 있다. 기본적으로 생명체, 특히 유전자 수준에서 인코딩(encoding)된 정보량이 막대하다는 사실, 그리고 이 정보량을 얼마나 빨리 해석하고 처리할 수 있느냐가 현대 첨단 바이오산업의 핵심이 되고 있다는 사실을 기억하라! 생명정보학, 생명공학, 신약개발, 백신개발, 시스템생물학, 나아가 합성생물학을 아우르는 첨단 바이오 분야에서의 정보 처리는 매우 중요한 기술이 될 것임은 쉽게 이해할 수 있다.
당연히 그 정보 처리에 걸맞은 반도체 칩은 필요하다. 인간 유전체가 저장하고 있는 데이터는 대략 3기가바이트(GB)다. 그러나 보다 아래 단계에서의 시퀀싱(sequencing, 유전자를 이루는 염기의 결합순서 읽기) 데이터는 훨씬 더 큰 용량이 크고, 유전체 복제 같은 실험에서 나오는 데이터는 이보다 더 용량이 커서, 최소 수십에서 최대 수백 테라바이트(TB)까지도 생성된다. 유전자 데이터를 읽고 분석하는데 반도체가 필수적인 것이다.
유전체 정보 읽고 거기에 알고리즘까지 지원하는 맞춤형 반도체
신약 개발이나 백신에서 있어 중요한 기술 중 하나인 단백질 구조 해석 역시 마찬가지다. 단백질은 아미노산의 사슬로 이루어진 고분자로서, 이들은 몸 안에서 3차원 구조를 가지며 접혀 있다. 이들의 접힌 구조는 단백질의 물리적, 화학적 특성을 결정한다. 접힘 구조와 발현되는 물리/화학적 특성과의 상호 관계 해석에는 대용량 데이터를 다룰 수 있는 분자-동역학(molecular dynamics) 모형 기반의 컴퓨터 시뮬레이션 연구가 필요하다.
구글의 인공지능 자회사인 딥마인드(DeepMind)는 최근 알파폴드(Alphafold)라는 딥러닝 기반의 단백질 구조 해석 알고리듬을 이용하여 수만 개에 달하는, 알려지지 않은 단백질 접힘 구조를 밝혀내기도 했다.
구글의 인공지능 자회사인 딥마인드(DeepMind)는 최근 알파폴드(Alphafold)라는 딥러닝 기반의 단백질 구조 해석 알고리듬을 이용하여 수만 개에 달하는 알려지지 않은 단백질 접힘 구조를 밝혀내기도 했다. / 사진=Google DeepMind
맞춤형 의료가 인공지능 기술을 만나 유전체 시퀀싱에 대한 수요 역시 매년 급증하고 있다. 암 유전자를 미리 발견하고 이를 토대로 유전자 교정을 하여 암 발생률을 낮추거나 노화 유전자를 고쳐 노화 속도를 늦추는 등의 연구가 점점 현실로 구현되고 있다. 이때 가장 많은 계산 자원을 필요로 하는 대용량 유전체 시퀀싱에 대해 전용 알고리듬을 지원하는 맞춤형 반도체 칩에 대한 수요는 그래서 더욱 구체화될 수 있다.
인간 유전체 읽는데 100기가, 분석 목적별 정렬, 나열하면 다시 수십 배
시퀀싱 데이터를 분석할 때 가장 많은 계산 자원을 필요로 하는 단계는 시퀀싱 데이터를 레퍼런스로 삼고 있는 유전체에 맞춰 순서를 나열하는 정렬 과정이다. 3기가바이트(GB)의 인간 유전체에 대해, 시퀀싱을 할 경우 조각들의 증폭과 복제로 인해 약 30~40배의 용량이 더 필요하기 때문에, 대략 100기가 내외의 원시 유전체 데이터가 생성된다.
이 데이터들을 예를 들어 BWA(Burrows-Wheeler Aligner, 버로우즈와 휠러가 개발한 전환기를 기반으로 헹리가 개발한 소프트웨어. 유전체 읽기 지도 제작에 쓰인다)나 Bowtie(유전체 서열 정렬 및 서열분석용 소프트웨어) 같은 정렬 도구를 활용하여 분석할 경우, NVIDIA의 A100 같은 GPU를 사용하면 10시간 정도가 소요된다. 정렬뿐만 아니라, 나열된 시퀀스를 다시 조립하는 단계(assembly) 역시 많은 계산량이 필요하다.
예를 들어 다양한 길이를 같은 DNA 조각들로 이루어진 연결 관계, 즉, 그래프 형태로 다시 정리하고, 그래프의 위상수학적 성질을 고려하여 재배열하는 과정에는 정렬보다 더 오랜 시간이 소요될 수 있다. 유전체 분석을 하는 큰 목적 중 하나인 유전체 변이 탐지 단계에서도 막대한 계산 자원이 소요된다. 정렬된 시퀀스에서 발견된 차이점이 통계적으로 유의한 수준인지 평가하기 위해 GATK 같은 툴킷을 사용할 수 있지만, 현재 이 툴킷은 CPU에만 특화되어 있다.
그렇지만 개인의 유전체 분석뿐만 아니라, 집단 유전체 시퀀싱에 대한 수요가 늘어나고 있고 (예를 들어 신약 개발을 위한 대조군/실험군 분석), 그 계산양은 집단의 크기의 제곱 혹은 세제곱에 비례하므로 (복수로 짝을 지어 비교해야 하므로), 현재의 컴퓨팅 하드웨어로는 수 주일, 심지어 수개월에 달하는 오랜 시간이 걸린다는 한계가 있다.
해당 목적만을 위해 특화된 로직 반도체라는 개념
이를 극복하기 위해 첨단 바이오 분야, 특히 유전체 시퀀싱 및 분석 분야에서는 그에 특화된 로직 반도체 설계가 시작되고 있다. 특히 병렬 처리 능력이 강화되고, 인공지능 기반 추론 기능이 추가된 NPU 등의 유닛이 같이 집적된 병렬 프로세서가 주목받고 있다. 또한 시퀀싱 데이터는 기본적으로 각각의 데이터 용량이 크므로, 처리 속도의 개선을 위해 원시 데이터의 로딩, 읽기, 저장 등의 과정에서 속도가 저하되는 일이 없도록 고속 대용량 메모리 기능도 병행하여 요구된다.
이는 NVIDIA의 A100 같은 GPU가 하이닉스의 HBM 3 같은 고속 메모리와 병행하여 같이 최적화되는 과정과 유사하다. 그렇지만 대용량 유전체 분석에는 HBM보다도 훨씬 더 큰 용량의 메모리가 필요하며, 이는 칩 사이즈가 더 커져야 함을 의미한다. 또한 시퀀싱 정렬 과정에서는 크기 비교 및 메모리 재배치 등의 단순한 논리/산술 계산이 반복되는데, 각 시퀀스에서 동기화하여 일부 단순 반복 계산을 메모리 안에서 미리 설정된 명령어 셋을 이용하여 처리하는 방식의 PIM(process in memory) 메모리도 향후 첨단 바이오 맞춤형 고성능 반도체 칩 설계에 있어 중요한 요소가 될 것으로 전망된다.
결국 첨단 바이오의 경쟁력은 유전체, 단백질, 각종 생체 분자 들의 대용량 정보량 처리 및 분석에 특화된 맞춤형 반도체 칩을 어떻게 설계하고 만들 수 있는지로 결정될 가능성이 높다.
엘리베이터 성능개선은 반도체에 달려 있다
다른 분야도 별로 다를 것은 없다. 필자는 지난 몇 년간 반도체 산업 분야는 물론, 그 외의 다양한 분야의 제조업 관계자들을 만나며 산업의 종류와 상관없이 한 가지 공통적인 관심사 존재함을 확인했다. IT 혹은 반도체 산업이라고 분류되기 어려운 기존의 전통 제조업에서도 다음 단계로의 도약을 위해 데이터를 활용하고 인공지능을 도입해야 한다는 공감대가 바로 그것이었다.
그렇지만 데이터나 인공지능, 혹은 나아가 4차 산업혁명 시대로의 전환 등은 이미 우리에게 익숙한 버즈워드(buzzword)일 뿐이며, 구체적인 전략은 모호하다. 기존 산업, 특히 제조업 분야에서 원하는 업그레이드는 이러한 단순한 구호에서 머무는 것이 아니다. 특히 업력이 오래된 산업일수록 축적된 데이터를 제대로 활용하는 것에 관심사가 집중된다.
존 디어가 농기계의 제작부터 활용, 그리고 수리 과정에 이르기까지 전 주기적 과정에서 수집된 다양한 고유 데이터를 활용하여 자율주행 농기계에 특화된 반도체 칩을 설계하고 제작하는 것처럼, 다른 산업 분야에서도 비슷한 시도를 충분히 할 수 있다. 엘리베이터 회사의 예를 들어 보자.
최소 에너지, 최대 수송량, 최소 대기 시간, 반도체의 엘리베이터 마법
엘리베이터에도 반도체 칩은 필요하다. 특히 고층빌딩에 필요한 고속 엘리베이터를 여러 대 동시에 제어해야 하는 경우, 최소한의 에너지로 최대한의 수송량을 최소한의 대기시간만으로 운영할 수 있게 하려면 다양한 경우의 수를 실시간으로 계산하여 우선순위를 정하는 계산이 필수적이다.
사우디아라비아의 실질적 권력자라고 자리매김한 왕세자 무함마드 빈 살만(Mohammed bin Salman Al Saud)이 2020년대 들어 본격적으로 추진하고 있는 거대 국가 프로젝트인 네옴(Neom) 프로젝트의 경우, 최대 길이 170km, 높이 500m에 달하는 거대한 구조물 한 쌍을 평행선 형태로 사막에 건설하여 신도시와 산업 및 관광단지를 만드는 것이 주요 골자인데, 이러한 구조물에서 중요한 기술 중 하나가 바로 엘리베이터다.
도시의 거대 구역 간 이동은 튜브형 지하 광역 철도 등을 이용할 수 있으나, 거대 구조물 내부에서의 단거리 수직-수평 이동은 훨씬 고난도의 엘리베이터 기술을 필요로 한다. 여러 대의 엘리베이터가 공용의 수직-수평 갱을 통해 빠른 속도로 오가면서 사람과 화물을 하루에도 수백~수천 번씩 수송해야 한다.
사우디아라비아의 왕세자 모하메드 빈 살만이 추진하고 네옴(Neom) 프로젝트의 경우, 최대 길이 170 km, 높이 500m에 달하는 거대한 구조물 한 쌍을 평행선 형태로 사막에 건설하여 신도시와 산업 및 관광단지를 만드는 것이 주요 골자인데, 이러한 구조물에서 중요한 기술 중 하나가 바로 엘리베이터다. / 사진=NEOM
존 디어처럼 엘리베이터 회사가 자체 축적된 데이터 있다면
이 과정에서 속도와 수송량의 증강은 물론, 사용 전력의 절감과 안전성 강화는 매우 중요하다. 이는 엘리베이터 회사 입장에서는 이전보다 더 고성능 제어 알고리듬이 갖춰진 전용 반도체 칩을 갖춰야 함을 의미한다. 관제소에서 일일이 수백, 수천 대의 엘리베이터 움직임을 모니터링하고 제어할 수 없으므로 기본적으로 자율제어 가능한 엘리베이터가 필요하며, 각 엘리베이터는 마치 자율주행차처럼 제한된 공간을 충돌이나 고장 없이 왕복할 수 있어야 한다.
국내의 주요 엘리베이터 회사들 역시 이러한 반도체 칩의 필요성을 인식하고 있으며, 국내외 다양한 건축물에 맞춤형으로 설계된 엘리베이터를 제작한 경험과 데이터를 이용하여 자사에 특화된 칩을 설계하려는 프로젝트를 시작하고 있다. 물론 엘리베이터 회사가 직접 반도체 칩을 설계할 수도 있고, 다른 팹리스 회사에 설계를 위탁할 수도 있겠지만, 여기서 관건은 그 회사가 가지고 있는 고유 데이터를 최대한 활용한 고성능 칩을 어떻게 설계하느냐일 것이다. 엘리베이터 회사가 가진 고유 데이터는 결국 가장 앞선 엘리베이터 제어를 위한 반도체 칩의 핵심 자산이 된다.
에너지 플랜트 신설에도 상황별 시간별 데이터로 비용 절감
중공업 분야에서 업력이 쌓인 어떤 국내 회사의 경우 주로 해외 플랜트 사업이 주된 사업 영역이었는데, 이 회사가 다루는 엔지니어링은 조력 발전소, 담수화 시설, 해양 석유화학 플랜트 등이다.
그런데 이러한 플랜트 사업 역시 다음 단계로의 업그레이드 압력이 거세지고 있다. 대부분의 플랜트 사업은 에너지를 대량으로 사용하는 산업이기 때문에, 향후 10~20년 안으로 신재생에너지 기반의 시스템으로의 전환이 요구된다. 해양 석유화학 플랜트는 한 때 자체적으로 화석연료를 수급하여 미니 화력발전소를 만들어 자체적으로 전력을 수급했다.
그렇지만 이제 화석연료 기반 발전은 점점 퇴출될 수밖에 없고, 조력, 풍력, 태양광 발전 등의 신재생에너지에 특화된 시스템으로의 변신이 필요하다. 에너지 수급 자원이 전혀 달라지는 상황에서 플랜트를 리엔지니어링(re-engineering) 해야 하는 작업은 고난도의 작업이며, 특히 복잡한 장치가 얽혀 있는 플랜트는 이 과정에서 플랜트 고유의 생산 과정에 지장이 생기면 안 된다.
신재생에너지의 수급뿐만 아니라, 탄소배출저감을 위한 플랜트 리엔지니어링도 점점 거세지는 압력에 처해있다. 각각의 공정은 화학반응과 물질 수송, 분리, 회수와 혼합 등의 과정이 반복되는데, 이러한 단위 과정(unit process)은 모두 과거의 탄소배출+화석연료 기반 발전 시스템에 기반을 두고 있다. 이러한 시스템은 이제 탄소제로배출 시대를 맞아 유효기간이 사실상 끝났으며, 다른 시스템으로의 조속한 업그레이드가 필요하다.
그런데 이 과정에서도 업력이 쌓인 업체들의 고유 데이터는 큰 역할을 한다. 논문이나 특허로는 보고되지 않는 다변수 공정 시계열 데이터로 이루어진 데이터베이스는 새로운 시스템으로의 업그레이드를 가능하게 하는 첨단 제어 전용 반도체 칩의 설계를 위한 주재료가 될 수 있다.
데이터 감시, 오류 징후 판단과 예방, 우회시키기
이미 미국과 독일의 화학 회사들은 파일롯 플랜트(pilot plant)에서 이러한 성능 변경의 가능성을 테스트하고 있으며, 일본의 화학 회사들은 전기화학공정으로의 변신을 계획하면서 공정 제어를 위한 맞춤형 반도체 칩의 설계 가능성을 타진하고 있다.
필자가 관련 학회에서 만난 네덜란드의 석유화학 회사 관계자는 미국의 몇몇 주립대학 교수들과 산학 프로젝트를 수행하며 탄소저감기술 CCUS(Carbon Capture, Utilization, and Sequestering)의 효율을 높일 수 있는 시스템 개발에 몰두하고 있는데, 그 방향성 중 하나는 시스템 효율 강화를 위한 공정제어 전용 인공지능 반도체 칩이다.
기존의 공정 제어용 반도체 칩은 수동적으로 공정 데이터를 입력받아 시스템 제어를 하는 신호 산출에 특화되었지만, 새로 업그레이드되는 인공지능 반도체 칩은 공정 데이터를 실시간으로 감시하며 오류의 징후를 확률적으로 미리 판단하여 사전 대응하고, 오류의 요소를 회피하거나 우회하게 해준다. 에너지 효율과 시스템 안정성을 모니터링하면서도 동시에 탄소 배출량의 한계를 유지하면서 생산품의 수익성 변동에 대해 탄력적으로 공정을 운용하는 것을 주요 성능 구현 지표로 삼는다.
원자력 발전소 역시 비슷한 케이스다. 원전 발전 시스템은 거시적으로는 일반적인 증기 터빈 기반의 발전 시설과 별로 다르지 않다. 고온고압의 증기 발생을 위한 에너지원으로 속도가 제어된 핵분열 에너지를 사용할 뿐이다. 그렇지만 원자력 발전소에 활용되는 발전 제어용 반도체 칩은 일반적인 산업용 혹은 전력 반도체보다 더 요구 조건이 가혹하다.
즉, 혹시 있을지도 모를 방사선 유출 환경에서도 안정적으로 제어 성능을 보장할 수 있어야 하기 때문이다. 이는 하드웨어 관점에서는 방사성 차폐가 잘 되어 있어야 함을 의미할뿐더러, 차폐를 뚫고 방사선에 일부 회로가 노출되는 환경에서도 필수 성능의 오류 가능성을 최소한으로 억제할 수 있는 이중삼중의 체크 포인트가 구현되어야 함을 의미한다.
제철, 조선, 국방, 통신, 각 산업에서 축적된 데이터가 한국 산업의 경쟁력
이러한 특수 용도의 반도체 칩은 당연히 원자력 발전소를 오래 운용한 측에서 가지고 있는 고유 데이터셋이 얼마나 반영되어 있느냐에 따라 성능이 달라진다. 특히 차세대 원자력 발전 시설로 고려되고 있는 SMR(small modular reactor)의 경우, 중앙 집중식 관제 시스템보다, 개별 발전 시스템에서의 정밀 제어가 더 중요해지는데, 각 발전 시설의 안정적인 운용과 신뢰성 확보는 SMR에 특화된 제어 알고리듬, 그리고 데이터가 반영된 반도체 칩이 요구된다.
소형모듈원전은 개별 발전 시스템에서의 정밀 제어가 더 중요해지는데, 각 발전 시설의 안정적인 운용과 신뢰성 확보는 SMR에 특화된 제어 알고리듬, 그리고 데이터가 반영된 반도체 칩이 요구된다. / 사진=위키피디아
농기계, 엘리베이터, 중공업, 플랜트 혹은 화학공업, 원자력 발전소뿐만 아니라, 비슷한 맥락으로 업력이 오래된 제조업에서 충분한 데이터가 쌓인 분야라면 비슷한 접근을 취할 수 있다. 제철이나 제련 산업, 조선 산업, 국방 산업, 통신 산업 등이 이에 해당한다. 이들의 공통점이 업력이 오래되었다는 것, 그리고 그에 비례하여 고유 데이터가 축적되어 있다는 것 외에 무엇이 있는가?
그것은 바로 한국이 지난 반세기 가까이 주력해 온 전통적 산업들이라는 것이다. 앞서 언급했듯, 이러한 산업들은 시대에 바뀜에 따라 조금씩 주안점이 바뀌긴 했어도 여전히 한국 제조업 생태계의 근간을 이루고 있으며, 서로 직간접적으로 영향을 주고받으며 내수 시장은 물론, 해외 시장을 겨냥하여 국부 창출에 기여하는 분야다. 한국에게 주어진 기회는 바로 이러한 기존의 산업들에 대한 기반이 하드웨어적 측면뿐만 아니라 소프트웨어적 측면에서도 충분히 잘 조성되어 왔다는 것이다.
글쓴이 권석준은
서울대 화학생물공학부에서 학사, 석사 과정을 마치고 MIT 화학공학과에서 박사학위를 받았다. 한국과학기술연구원(KIST) 첨단소재기술연구본부 책임연구원을 지냈고 차세대 반도체 소재 및 광(光) 컴퓨터, 양자 컴퓨터 등의 차세대 IT소자 원천 기술 등을 연구 중이다. 현재 성균관대 화학공학부, 반도체융합공학과 교수로 재직 중이며, 지금까지 80여 편의 논문을 해외 저명 학술지에 게재했다. 최근 한·중·일 반도체 산업에 관한 저서 <반도체 삼국지 (뿌리와이파리 2022)>, <차세대 반도체 기술 (플루토 출판사, 2023 예정)>을 출간했다.
|