1.PC레벨 최초의 그래픽 통합 프로세서 |
---|
자. 인텔이 준비해오던 네할렘 기반의 듀얼코어 프로세서, 보통은 클락데일이라는 코드명으로 잘 알려졌던 Core i5 6XX 군과 Core i3 및 Pentium G6950 시리즈가 드디어 나왔다. 이것으로 인텔은 메인스트람 상위 이상은 신 아키텍처, 메인스트림 하위 및 퍼포먼스-밸류 라인은 구 아키텍처에 의존하던 과도기형 라인업을 벗어나 네할렘 아키텍처만으로 모든 라인업을 꾸리는 것이 가능해졌다.
이들 듀얼 코어 프로세서들의 가장 큰 특징은 하나의 패키지 안에 CPU와 GPU가 별도의 코어를 가진 채로 집적되었다는 점이다. 어찌 보면 쌍동선을 만들듯이 제조했던 인텔 초기의 듀얼 코어군과 닮았다. 물론 최종적으로는 스미스필드가 코어 프로세서로 진화하며 다이 하나로 합쳐지듯 CPU와 GPU의 통합 다이, 거기서 다시 인텔이 라라비 프로젝트에서 지향하는 것처럼 단일 코어 내에서 FPU 연산 유닛이 그래픽 작업을 수행하는 쪽으로 나가게 되는 만큼 현재의 클락데일은 내년 말 예정인 샌디 브릿지, 또는 2014년쯤에 나올 라라비 적용 프로세서로 가는 징검돌인 셈이다.
케이벤치는 오늘 발표되는 클락데일에 대한 기사를 마련하는 데 있어서 크게 네 부문을 다룰 예정이다. 클락데일에 대한 기술적인 부분, 그리고 'CPU'로서의 클락데일과 'GPU'로서의 클락데일, 마지막으로 클락데일을 위한 H55 칩셋(메인보드)이다. 그 중 첫번째로 이번 기사에서는 클락데일의 아키텍처-CPU와 GPU부문 모두-를 설명하도록 하겠다. |
2.린필드와의 구조 비교 및 다이 살펴보기 |
---|
클락데일과 린필드, 공통점과 차이점 클락데일의 CPU 아키텍처는 네할렘 기반-정확히 말하자면 네할렘에서 공정 미세화를 이룬 웨스트미어(Westmere)-인 만큼 각 코어들의 구조에 있어서는 딱히 새로 볼 것이 없다. 클락데일에서 주목할 것은 CPU 코어 아키텍처보다는 CPU코어와 아이언 레이크(Iron Lake)라는 코드명의 GMCH코어의 그래픽의 집적 방식 및 GMCH 아키텍처다.
때문에 클락데일은 린필드와 마찬가지로 원칩 타입의 보드 칩셋과 함께 2-chip 체제를 이룬다. 다만 그래픽 기능이 들어가는 만큼 각 칩에 들어가는 컴퍼넌트에는 차이가 있다. 예전에는 마더보드 GMCH에 들어가던 iGFX가 프로세서로 옮겨갔기 때문이다. 또한 그래픽 데이터를 주고받기 위한 전용 인터페이스인 FDI(Flexible Display Interface)가 추가되었다.
Core i7 8xx 및 Core i5 750 등 린필드와 같은 소켓 방식을 사용하는 만큼 외견이 동일하지만 실물 CPU의 뚜껑을 따 본다면 아래는 이렇게 되어 있을 것이다. 위의 작은 다이는 CPU 코어, 그리고 아랫쪽 다이는 GMCH 코어다. 앞 페이지에서 서술한 대로, 한 패키지에 두 개의 다이가 들어가는 MCP(Multi-Chip Package) 디자인이다. 양 코어는 공정이 다른데, CPU 다이 부분은 32nm 공정(Westmere), GMCH 다이 부분은 45nm 공정으로 제조되고 있다.
프로세서를 뒤집어보면 양자를 확연하게 구분할 수 있다. 왼쪽이 린필드 Core i7 870, 오른쪽은 클락데일의 Core i5 661 프로세서다. 대칭에 가깝게 레지스터 및 캐패시터가 배치된 린필드와는 달리 클락데일은 좌우의 비대칭성이 두드러진다. CPU 다이 부분이 있는 오른쪽은 린필드와 유사한 스타일이지만, GMCH가 있는 왼쪽은 특정한 형태를 잡기 어려운, 부정형의 레지스터 패턴을 보인다. 클락데일의 프로세서 다이
사진 좌상단은 클락데일 CPU다이와 GMCH다이, 우하단은 린필드 다이의 레이아웃이다. 위 사진에서는 영역 비교를 위해 CPU 부분 다이의 크기를 비슷하게 맞췄지만, 순수하게 프로세서 부분만의 크기를 비교한다면 45nm 공정의 린필드보다 32nm 웨스트미어 기반인 클락데일 CPU 다이가 훨씬 작다. 인텔에서 밝힌 자료에 따르면 린필드는 292㎟, 클락데일의 CPU 다이는 81㎟로 반 이하다. 물론 클락데일에는 114㎟의 그래픽 다이가 추가로 붙는다. CPU 다이를 보면 '린필드의 반쪽' 이라고 불러도 될 법하다. 코어와 L3 캐시가 반토막나고 기존 린필드에서 언코어 영역으로 불리던 컨트롤러 부분을 딱 떼면 웨스트미어 프로세서 다이 모양이 나온다. MCP(Multi Chip Package) 인터페이스라는 것이 웨스트미어에 추가되었는데, 이는 클락데일의 프로세서 다이와 GMCH 다이간의 통신용이다. 그럼 CPU 다이와 GMCH간의 버스는 무엇인가, 블룸필드와 X58에서 CPU와 IOH 간에 사용되었던 QPI가 유력하다. 린필드에서도 코어-PCH간의 버스인 DMI만 알려졌지만, P55 계열 마더보드의 BIOS설정 부분에서 QPI 버스 클럭 설정 항목이 존재하는 것으로 보아 비슷한 방식을 사용할 것으로 보인다. 파트의 위치가 여기저기로 이동했을 뿐, CPU 다이가 기본적으로는 네할렘 코어 스타일을 유지하고 있다. , GMCH 다이는 어떨까? GMCH 다이를 이루고 있는 파트를 보면 G3x나 G4x인텔의 구 GMCH파트를 이루는 부분이 거의 그대로 들어갔다. 옛 GMCH와 비교할 때 빠진 부분은 그래픽 출력단을 위한 디스플레이 인터페이스 컨트롤러로, 이 부분은 H5x/Q5x 칩셋으로 넘어간다. |
3.그래픽 코어 아키텍처 |
---|
Intel Graphic Media Accelator HD 인텔에서 만드는 내장 그래픽 가속기는 크게 두 가지의 흐름이 있다. 하나는 945G 칩셋의 GMA950으로 대표할 수 있는 픽셀/버텍스 분리형 셰이더 가속기, 또 하나는 인텔에서 G965 칩셋을 내면서 만든 GMA X3000을 시작으로 하는 통합 셰이더 아키텍처 가속기다. 분리형 셰이더 가속기는 인텔 차기 Atom에도 발전형(?)이 탑재되면서 아직도 명맥을 잇고 있지만, 거저에 가까운 가격으로 화면을 보여준다는 점을 빼면 기술적으로는 낡디 낡은 것이다. 2006년 말 엔비디아에서 최초로 DX10 지원 카드를 내놓으면서 이후 나오는 새로운 GPU들은 전부 통합형을 사용하기 때문이다. 그러므로 클락데일의 그래픽 코어인 아이언 레이크는 지극히 당연하게 G965를 계승하고 있다.
분리형 아키텍처를 사용하던 당시의 인텔 iGPU는 사실 픽셀 셰이더만 가지고 있었고 버텍스 셰이딩은 소프트웨어적으로 처리했다. 분리형 아키텍처 GPU로서도 반쪽이었던 셈이다. 반면 통합 셰이더 아키텍처는 '이 녀석은 버텍스, 저 녀석은 픽셀 처리' 하는 식으로 셰이더마다 임무가 정해졌던 방식을 탈피해 모든 셰이더가 부하에 따라 역할이 유동적으로 바뀌게 된다. 각 GPU 벤더마다 '스트림 프로세서' 등 독창적인 이름을 사용하는데, 인텔은 이를 처리 유닛(Execution Unit)이라고 부른다.
또한 Dynamic Frequency라는 기술도 주목을 해볼만한 가치가 있다. 프로세의 성능과 소비전력 사이의 균형을 잡는 Turbo Boost가 그래픽 코어까지 포함해 확대된 개념으로, 이는 CPU보다 GPU쪽에 높은 연산이 요구되는 상황이 되면 내장 그래픽 코어의 클럭을 끌어올리는 대신 CPU쪽의 클럭을 낮추는 방법으로 TDP값을 넘지 않는 한도 내에서 그래픽 성능을 높인다. 단 이는 현재 노트북용 프로세서인 애런데일 한정으로, 데스크탑용인 클락데일에서는 지원하지 않는다. 그러나 샌디 브릿지(Sandy Bridge)가 되면 보다 유연하게, 또한 보다 폭넓게 기술이 적용될 수 있지 않을까? 3D 지원
3세대라고 하는 클락데일의 3D 통합 셰이더 아키텍처가 단순히 처리 유닛의 숫자만 늘어난 것이 아니라 바로 이전 세대의 최상위 모델인 GMA X4500HD과 비교할 때 구체적으로 어떤 개선점이 있는지 정리한 표다. 강조되는 것은 하드웨어 버텍스 프로세싱에서 클립/컬/셋업 성능의 향상과 계층적 Z값 처리 및 고속 Z 버퍼 비우기 기능의 지원이다.
3D 오브젝트를 만들어내는 작업을 보다 빠르게 처리하기 위한 방법에는 여러 가지가 있는데, 가장 간단한 건 '어차피 눈에 보이지 않을 부분은 작업하지 말자' 다. 인텔이 새 그래픽 아키텍처에서 강조하고 있는 신 기능들은 전부 이와 관련돼 있다. 매우 간단하게 설명하자면 시야에 들어오지 않는 부분의 작업 처리를 하지 않는 것이 클리핑, 앞의 물체에 가려져 보이지 않는 부분을 무시하는 것이 컬링이다. 이 부분은 기존 세대에서도 하지 않는 것은 아니었지만 새 셰이더 아키텍처에 와서 기능을 보다 강화했다고 한다. 또한 컬링 작업을 하려면 각 오브젝트간의 거리를 파악하는 작업이 필요하다. 3D 그래픽에서 오브젝트와 시각 기준점 사이의 거리 좌표, 보통 깊이라고 부르는 것을 Z값이라고 부르는데, 계층적 Z 분류(Hierachical Z) 기능은 오브젝트들의 거리를 파악하고 그 순서를 정리해 보다 손쉬운 컬링 작업이 이뤄질 수 있도록 한다. 또한 이 때 데이터로 꽉 찬 Z 버퍼를 다음 작업을 위해 지정된 특정한 값으로 덮어씌워 재빠르게 비우는 기능이 고속 Z 버퍼 비우기다. 이 두 가지는 양 대 GPU 벤더에서는 이미 지원하고 있던 기능으로, 좀 늦었지만 다른 GPU들을 이제 따라잡은 셈이다.
3D 작업을 위한 처리 유닛이 10개에서 12개로 둘 늘어난 것 외에 처리 능력의 강화를 위해 이뤄진 변화 중 '가장 빨리 와닿는 것' 이라면 클럭 상승이다. 클락데일에서는 GPU 클럭이 최대 900MHz인데, 사실 이것은 클락데일 중에서도 Core i5 661에만 해당되며 Core i5 6x0 및 Core i3 클락데일은 코어 클럭이 733MHz다. 그리고 이 표에는 없지만, 클락데일에 사용하는 메모리의 클럭이 올라감에 따라 메모리 대역폭에도 향상이 있다. GMA X4500HD 세대의 메모리 대역폭은 DDR2 메모리 사용시에 12.8GB/s, DDR3 메모리에서는 17GB/s 였지만 클락데일은 최하위 모델을 제외하면 대역폭이 21.2GB/s다. 메인 시스템에서 끌어다 쓰는 그래픽 버퍼(DVMT) 지원 역시 1.7GB까지 올라갔다(단, OS에 따라 차이가 있다). 셰이더 모델은 4.0그대로이지만 OpenGL API 지원이 버전 2.1로 올라갔다. |
4.동영상 및 디스플레이 지원 |
---|
인텔 내장 그래픽 코어는 아무래도 전문적으로 그래픽 코어에 매달려오지 않았던 만큼 3D 그래픽 처리 능력과 멀티미디어 프로세싱 모두 외장 그래픽 카드들에 비해 열세인 편이다. 그래도 GMA X4500HD에 오면서 일단 '스킬' 면에서는 구색을 맞추게 되었지만 규모로 승부하는 그래픽 프로세서의 세계에서 칩셋 또는 CPU에 내장해야 하는 한계상 탑재할 수 있는 프로세서 유닛의 수가 제한되기 때문에 여전히 3D 그래픽 성능에서는 외장 카드들에 미치지 못한다. 하지만 동영상 프로세싱 쪽은 물리적인 규모가 커야 할 필요가 없기 때문인지 기술의 탑재가 곧바로 격차 해소로 이어진다. 초반에는 동영상 처리 가속 기능이 미비했지만 GMA X4500HD에 와서는 그럭저럭 '남들 다 하는' 것은 해낼 수 있는 수준이 되었다.
X4500HD부터 모든 포맷 동영상의 가속 지원이 가능해지고 대부분의 포스트 프로세싱 작업도 처리할 수 있게 되었기 때문에 남들이 하는 것은 거의 다 할 수 있는 수준이 되었다고 하더라도 역시 동시대의 외장형 그래픽카드들이 제공하는 기능과 비교하자면 2%..아니 그보다 조금 더 부족했다는 말할 수 있겠다. 클락데일은 이 부분을 메꿔줄 수 있을 것이다.
첫째, 듀얼 비디오 디코딩이 가능해졌다. 요즘 Blu-ray 소스 중에는 위 스크린샷처럼 메인 영상과는 별개의 영상을 따로 띄워 마치 PIP(Picture-in-picture; 다중 화면)처럼 만드는 경우가 있다. 이런 소스는 화면은 하나에 나오더라도 당연히 여러 개의 동영상을 각각 디코딩해줘야 한다. 물론 요즘 나오는 모든 외장 그래픽 카드라면 이미 지원하고 있는 기능이지만 GMA X4500HD에서는 불가능했는데, 클락데일부터는 외장 그래픽 카드들과 마찬가지로 듀얼 비디오 디코딩 작업을 할 수 있다. 또한 동영상 포스트 프로세싱에서도 기존 SD영상만 가능했던 샤프니스 처리가 HD영상까지 가능해지면서 업스케일링시 보다 자연스러운 화면을 출력할 수 있다. 그리고 2006년 이후 디지털 TV 등에서 보다 자연스러운 색상의 표현을 위해 강조하고 있는 xvYCC 색 영역을 지원하게 되어 기존의 색상 표현법에 비교할 때 두 배 이상의 컬러를 표현할 수 있다. 이것은 HDMI 규격 스펙 지원의 확장과도 관련이 있다.
자, 디스플레이 출력 지원에서의 변화 부분이다. 앞서 동영상 가속이나 포스트 프로세싱 부분에 비해 'New' 가 눈에 많이 띌 것이다. 지원 출력단의 종류에서야 변화가 없지만 오디오 스트리밍을 포함한 듀얼 HDMI 지원과 더불어 픽셀당 색 비트의 증가(12bit 지원), HDCP 듀얼 스트림 지원이 있다.
그리고 무엇보다도 HDMI 1.3 규격의 의의(?)가 여기 있다고 해도 될 만한 Dolby TrueHD 및 DTS-HD 오디오를 지원하는 것을 주목하자. 작년 초까지만 해도 PC로 홈 시어터를 구축할 때 그래픽카드들이 HDMI 출력은 지원하지만 이들 두 가지 무압축 오디오 패스스루를 지원하지 않아 별도의 사운드카드가 있어야만 '무압축 오디오까지 완벽한' 홈 시어터가 가능했었다. 항상 몇 발짝 뒤쳐져 있다고 느껴졌던 인텔의 GMA로서는 상당히 인상적인 스펙이다. 정리하자면 클락데일은 xvYCC, deep Color, TrueHD 및 DTS-HD의 지원이 가능해졌다는 이야기. 이는 인텔에서 명시하지는 않았지만 실질적으로 HDMI 1.3급의 스펙을 클락데일이 사용하고 있다는 이야기로 받아들이는 것이 가능하다. 또한 DisplayPort 도 1.1 스펙을 클락데일에서 지원하고 있다. |
5.클락데일 프로세서의 제품군 구성 | |||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
인텔은 클락데일 프로세서를 현재 Core i5와 Core i3, 펜티엄 G 시리즈의 3개 군으로 나눠놓고 있다. 그런데 Core i5 시리즈 내에서도 뒷 자리 숫자가 0으로 끝나는 제품들과 1로 끝나는 두 가지 제품군으로 나뉘기 때문에 총 4가지 시리즈라고 볼 수 있다.
인텔이 Core i5를 다시 두 가지 제품군으로 나는 이유는 각 프로세서가 상정하고 있는 시장이 다르기 때문이다. Core i5 650/660/670 세 가지 제품군은 일반 유저보다는 비즈니스 분야 지향(쉽게 말해 사무용)으로, 그래픽 코어의 클럭이 733MHz 지만, 가상화에서 Directed I/O(VT-d)와 더불어 vPro 및 TXT(Trusted Execution Technology)를 지원하고 있다. 반면 Core i5 661은 이들 세 가지 기능은 빠지는 대신 그래픽 코어의 클럭을 900MHz까지 끌어올린 일반 유저 대상이다. 또한 Core i5 계통 클락데일에는 AES 암호화에 관련된 부분의 연산을 가속화시키는 인스트럭션(AES-NI)이 추가되어 있다. Core i3 시리즈는 퍼포먼스급 레벨인 만큼 그래픽 클럭은 Core i5 6x0시리즈와 동급, 기타 기능들에 있어서는 Core i5 661과 지원 수준이 비슷하다. 단 이들 시리즈에서는 터보 부스트를 지원하지 않는다. 마지막으로 펜티엄 G6950은 터보 부스트와 하이퍼스레딩이 다 빠지고, 그래픽 클럭도 533MHz로 낮춰놓았다.
실제로 오늘 인텔이 준비한 클락데일 CPU는 메인스트림인 Core i5 계열 네 종, 퍼포먼스급 Core i3 두 종이다. 인텔은 밸류급으로 Pentium G6950도 준비해놓고 있지만, 일단 오늘의 발표 리스트에서는 빠져 있는 것으로 보인다. 위의 표를 보면 재미있는 점이 한 가지 있는데, Core i5 661과 Core i5 660이 동일한 출고가와 스펙값을 갖고 있다. 같은 CPU를 왜 따로 내나 싶다면 가장 위의 표를 한 번 더 참고하자. 프로세서부의 일반적 스펙은 Core i5 661과 Core i5 650이 동일하지만 가장 위의 표에서는 밝혔던 부분, 즉 Core i5 661은 부가 기능(VT-d, TXT, vPro)을 희생하고 Core i5 660은 GMCH 클럭(900MHz->733MHz)을 희생한 것이다. Core i5 661의 TDP가 다른 프로세서들에 비해 높은 것은 순전히 GMCH 클럭을 올렸기 때문이라고 봐도 될 것이다. |