|
사상 최고 클럭의 데스크탑 CPU
말도 많고 탈도 많았던 인텔의 파란만장한 프로세서 제품군의 역사를 돌이켜볼 때, 필자의 뇌리에서 결코 떠나지 않는, 실은 선입견에 가까운 인텔 최대의 장점은 역시 업계 최고 수준의 공정 기술에 있는 것 같다. 마이크로프로세서의 양산에 있어서는 설계만큼이나 공정의 노하우나 뒷받침 (여기에서 굳이 프론트엔드니 백엔드니 하는 관련용어를 쓰고 싶지도 그럴 필요도 느끼지 못하겠다) 이 매우 중요한데, 인텔은 IBM과 더불어 이 분야에서 업계 최고 수준이어 왔고 또 현재도 그렇기 때문이다. AMD가 만약 지금의 인텔과 대등한 수준의 공정 시설과 기술을 확보하고 있었더라면 적어도 x86 마이크로프로세서의 역사는 크게 바뀌었을 것이다.
네메시스라고 하기에는 다소 초라할 정도로 차이가 나는 경쟁사인 AMD가 회심의 역작이었던 AthlonXP 프로세서로 가격대 성능비에 있어서 사상 최고 수준의 프로세서를 내놓았던 것이 엊그제 같지만, 인텔 역시 FSB의 800MHz 직행이라는 초강수를 통해 단순한 클럭의 산술 대비가 아닌 실제 성능상에서도 지존의 자리에 재등극하는데 성공했던 것이 이른바 P4「C」클래스들이다. (사실 필자로서는 기존의 0.13㎛ Northwood 코어에 거의 변형을 가하지 않은 상태로 이 정도의 수율로 양산이 가능하다는 것이 더욱 놀라울 따름이지만…)
이제 인텔은 탈환한 왕좌를 반석에 올려놓기 위한 최고클럭, 3.2GHz를 내놓는다. D1 스테핑의 P4 3.2GHz, 그 성능은 어느 정도일까.
▲ 리뷰용 제품 사진. |
제품 사양 |
|
제품명 |
Pentium 4 3.2GHz |
제조사 |
|
패키지 |
mPGA478 |
L1 캐시 |
8KB ( + 12KB Execution Trace Cache) |
L2 캐시 |
512KB |
시스템 버스 클럭 |
800 MHz |
제조공정 |
0.13 ㎛ |
동작전압 |
1.550 V |
기존의 C 클래스 P4 프로세서와 사실상 동일한 공정으로 제조되므로, 프로세서의 외양, 이를테면 (써멀) 캐패시터의 배치 등도 기존의 그것과 비교해 완전히 같다.
▲ 이렇게만 놓고 보면 3.0CGHz와 구분이 불가능하다 |
소비전력 등의 관심사에 대해서는 인텔의 공식 발표 시점인 23일 이전까지 입수가 사실상 불가능했다. 동작전압은 D1 스테핑의 현재 공시 최고값이 VID 1.550V 인데 여기에서 특별히 가압할 이유는 없다고 생각되며, 아마도 3.4GHz까지 동일한 전압이 유지될 가능성이 있으나 수율 여하에 따라 조정될 가능성도 배제하기는 힘들다. 특히 소비전력의 경우 실측과 통상 동작환경에 대한 정의 등을 통한 제조사의 공시값이 절대적이므로 자료가 공개될 때까지 기다려 보는 수밖에 없다. 이미 3.0GHz가 82W 가량에 육박하고 있는 바, 90W를 상회할 가능성도 있다. 다만, 실제 동작에 있어서는 기존의 정품 쿨러 사용에서 아무런 문제점을 찾을 수 없었다는 정도만 밝혀둔다.
성능 테스트
좀더 시간 여유가 있었다면 아래에 나열해 놓은 것보다는 약간 다른 핀트의 테스트를 의도하고 있었지만, 항상 그렇듯 시간에 쫓기다 보니 깊이 있는 테스트는 진행하지 못하고 다소 약식으로 진행했음에 양해를 구한다. CPU 사용 관계상 3.0GHz와의 비교에서는 부득이 3.2GHz 제품의 다운클럭으로 (배율기를 15X로 낮춤) 운용할 수밖에 없었음도 밝혀둔다.
테스트 방향은 인텔과 AMD의 현재 최고 플랫폼에서의 성능 비교를 목적으로 했으나 오버클럭 지향의 튜닝은 배제하는, 순정 지향으로 셋팅했다. 이를테면, PC3200 메모리 모듈의 타이밍은 3.0 - 4 - 4 - 8 로 통일시켰으며, 메모리 바이오스의 SPD 인식을 전적으로 신뢰한다는 가정하에 테스트를 진행하는 식이다.
테스트 사양 |
||
CPU |
Pentium 4 3.0C / 3.2GHz 1) |
AMD AthlonXP 3200+ 2) |
M/B |
Intel D875PBZ 3) |
FIC AUI3 Master 4) |
VGA |
ATi RADEON 8500 LE (64MB) |
|
메모리 |
삼성전자 PC3200 (DDR 400MHz) 256MB×2 5) |
|
HDD |
Seagate Barracuda ATA-IV 40GB 6) |
|
SPS |
Heroichi HR300-ART |
|
ODD |
LG전자 CRD-8483B |
|
운영체제 |
Microsoft Windows XP Professional SP1 (English) |
|
드라이버 |
Intel INF Update
5.00.1012 |
nVidia nForce UDP 2.03 |
비고 |
1) 3.0C는 3.2GHz를 다운클럭으로 사용 (각각
200MHz×15, ×16) |
테스트에 앞서 참고로 WCPUid 3.1a를 이용해 실클럭 조사 및 3.2GHz의 D1 스테핑 점검을 해 보았다.
▲ P4 3.2GHz |
▲ AthlonXP 3200+ |
우선은 CPU 연산 성능 위주의 코어 벤치마크부터 살펴보자. 이러한 부류의 어플리케이션은 다중 프로세서 환경에 민감하게 반응하는 편이기 때문에, 하이퍼스레딩 (이하 HT) 의 ON/OFF 설정 여하에 따른 성능 차이도 조사했다.
SANDRA 2003 SP1의 결과는 그야말로 3.2GHz의 압승을 보여준다. 이미 3200+의 저열한 성능은 잘 알려져 있는 바인 만큼 크게 문제될 것도 없지만, 3.0GHz와 비교했을 때에도 3.2GHz의 성능 우위는 확연하게 드러난다. 문제는 이러한 연산 성능이 실제 성능차로 직결될 수 있느냐의 여부일 것이다.
CPU보다는 플랫폼 자체의 특성을 보여준다고 생각하면 될 듯하다. 물론 본 기사의 주제라고 할 수 있는 내용과는 거리가 있지만, 참고용으로 의미가 있다고 생각되어 기재해 놓는다. 아직까지는 875P의 고유 기능이라고 할 수 있는 PAT 등의 테크놀러지가 적용하는 것도 있겠지만 같은 듀얼채널 PC3200 모듈의 성능차도 이 정도이다. FSB 대역에 직결되는 중요한 파라메터로서, 이후의 어플리케이션 벤치마크에서 영향을 미칠 것은 자명하다.
SANDRA만 갖다 넣기에는 너무 한산해서(?) 궁리 끝에 ScienceMark 2.0β의 일부 결과를 비교해 보았다. (ScienceMark의 결과는 실행 소요 시간이므로 값이 높을수록 성능이 떨어지는 것임에 유의하기 바란다.) Primordia 벤치마크는 극단적으로 설명하자면 원자 단위의 포텐셜값을 양자 물리에서 말하는 슈뢰딩거 방정식의 반복 연산을 통해 계산하는 것인데, 사실 CPU 성능 자체보다는 버스 대역에 대한 의존도가 높다. 또한 기본적으로 AMD 친화적인 성향이 강한 어플리케이션이라는 점도 염두에 둘 필요가 있다.
미시 물리 현상을 설명하는 데 있어 가장 대표적인 컴퓨터 시뮬레이션 방법인 MD(Molecular Dynamics)의 실행 결과는 멀티스레딩 의존성과 더불어, AMD 친화적인 ScienceMark 에서조차 P4 3.2GHz의 성능이 가장 우수한 것으로 나타났다는 점에서 주목할 만하다.
ScienceMark의 결과는 논란의 소지가 있으며 (다른 여타 벤치마크 결과는 한정된 시간 내에 한정된 기사에서 모든 것을 설명하기에는 다소 무리가 있어 부득이 제했다) 컴파일러 의존적인 측면도 적지 않기 때문에 2.0β와 같은 실행 화일 배포형태에서는 특히나 특정 플랫폼 편향적인 성격이 강하게 드러나기 일쑤이다. 어쨌든 이러한 악조건(?)하에서도 놀라운 성능 향상을 기록한 3.2GHz의 성능적 약진은 확실히 주목할 만하다는 것.
마지막으로 연산 성능에 큰 영향을 받으며 또한 멀티스레딩에 상대적으로 매우 민감한 몇 안되는 간단한 어플리케이션 가운데 하나인, 동영상 인코딩의 측정 결과를 비교해 보자. 역시 소요 시간이기 때문에 값이 클수록 성능이 떨어지는 것이다.
물론 결과는 P4 3.2GHz의 압승. 전통적으로 P4의 우세가 두드러졌던 영역이기도 하다.
이제 CPU 연산 위주의 결과보다는 실제 어플리케이션 성능 위주로 방향을 바꾸어 보자. 이 경우 아래의 테스트 어플리케이션들을 살펴보더라도 알 수 있겠지만, 멀티스레딩 지원은 사실상 거의 전무할 뿐 아니라, 사실 HT 지원 자체가 고클럭 P4 프로세서의 기본 사양임을 감안하여 HT 유무에 따른 성능 차이 (실제로 거의 없다) 는 생략했다.
그야말로 이러한 부류의 테스트 결과의 대변자라고 할 수 있는 3DMark 2001의 결과이다. 잘 알려져 있는 3200+의 열세가 3.2GHz의 약진과 대조를 이루고 있는 것을 볼 수 있다. 1024×768을 넘어서는 해상도에서는 시스템 성능의 병목 요소가 전적으로 비디오 카드로 옮아가므로 성능차이가 사실상 0으로 좁혀지는 것은 당연한 결과.
지겨울 정도로 애용하는 UT2003의 데모버전을 이용한 벤치마크는 그만큼 매우 유용하다. 3DMark 2001과 거의 동일한 핀트의 결과를 보여주는 Flyby뿐 아니라, 응용 프로그램의 실제 성능 체크에 긴요한 Botmatch 벤치마크가 제공되기 때문이다. P4 3.2GHz의 일관적인 성능 우위가 더욱 두드러지는 순간이다.
CPU나 메모리 위주의 벤치마크에 있어서는 아직도 꽤 효과적인 지표로 사용할 수 있는 OpenGL 기반의 Quake III Arena 역시 동일한 경향을 보여준다.
풀 OpenGL 기반의 고사양 / 고성능 워크스테이션급 어플리케이션의 3DMark라고 할 수 있는 SPEC의 viewperf 셋이 7.1로 업데이트되었다. 실제 체감 성능 측정이라는 측면에서 테스트를 수행해 보았지만, 위의 테스트 사양에서도 알 수 있는 것처럼 비디오카드의 사양이 이러한 용도로는 다소 부적합한 (RADEON 8500) 때문인지, 몇 가지 테스트 셋을 제외하면 거의 동일한 결과가 얻어졌다. 또한 플랫폼에 대한 약간의 의존성도 갖고 있어 결과는 다소 혼란스러운 것이 사실인데, 3.0GHz에 대해서는 확실한 성능 우위를 지키고 있는 것은 당연하나 3200+과의 비교는 어려울 정도.
여기에서도 볼 수 있는 것처럼 DataExplorer (dx-08) 과 DesignReview (drv-09) 뷰셋의 경우 경향이 뒤집혀 있는 반면 이외의 뷰셋에서는 사실상 타이를 이루고 있다.
게임 사양이 아닌 일반 GUI 가속 수준에서의 체감 성능에 그래도 근접해 있지만, 전형적인 인텔 친화적인 벤치마크 프로그램 가운데 하나인 SYSMark 2002의 결과이다. 3.0GHz와 3.2GHz의 200MHz의 클럭 폭이 이 정도의 체감 폭을 갖는다는 정도가 의미가 있다고 생각하는 것이 나을 것이다.
요약하자면, 제대로 된 CPU / 시스템 성능 측정 결과는 SANDRA 2003과 3DMark 2001, UT2003의 것을 비교하는 것이 필자를 비롯한 일반 사용자적인 측면에서 가장 이해하기도 쉽고 실제와도 근접해 있는 셈이다. 물론 그 결과는
P4 3.2 GHz > P4 3.0 GHz > Athlon XP 3200+
의 경향이 일정하게 유지되고 있다.
사상 최고 수준의 클럭, 성능, 발열, 소비전력, 그리고 가격
CPU 벤치는 특정 플랫폼 지향적인 요소가 적지 않아 대량의 아드레날린을 뿜어내게 만드는 측면이 있지만, 어쨌든 앞서 요약했던 바와 같이 사상 최고 클럭인 3.2GHz의 메리트는 분명히 존재한다. 워낙 높은 클럭이기 때문에 다분히 그럴 만도 하겠지만, 역대 최고 클럭이라는 점은 역사적으로도 의미가 있다.
▲ 말도 많고 탈도 많지만 인텔은 HT로 간다 |
인텔의 최고 클럭 제품이 항상 그랬던 것처럼, P4 3.2GHz 역시 사상 최고 수준의 클럭에 못지 않는 발열량과 소비전력, 그리고 가격으로 일반 사용자들과는 거리가 있는 것이 사실이다. 특히 기존의 3.0GHz가 80W대의 소비전력을 기록했던 것을 감안하면 3.2GHz는 인텔로서는 기록적인 소비전력과 그에 따른 발열량을 기록할 것으로 우려되지만, 놀라운 것은 실제 사용시에는 기존의 순정 쿨러로도 아무런 동작상의 하자를 찾아볼 수 없었다는 데 있다. 다시한번 인텔의 강력한 공정 기술력에 경의를 표하는 바이다. 가격대는 아무래도 533MHz가 최고 FSB 였던 시절의 3.06GHz 전후로 책정되어 있어서인지 엄청난 임팩트는 아니지만, 역시 당장 현실적인 가격은 아니다. 촌각을 다투는 퍼포먼스가 중시되는 워크스테이션급 고사양 데스크탑이 3.2GHz의 초기 시장의 대부분을 차지하게 될 것이다.
이제 인텔의 다음 뽑기는 3.4GHz, 그리고 0.09㎛ 공정으로 제조되는 코드네임 프레스콧 시대가 바톤을 넘겨 받을 채비를 하고 있다. 시스템의 체감 성능에서 키 역할을 하는 FSB 업클럭은? 차세대 DDR 테크놀러지의 도입은? 인텔의 질주는 계속된다.