새로운 펜티엄4, 인텔 프레스캇(Prescott)
요즘 CPU 시장 동향을 본다면 다소 혼란이 일 수 있다. 인텔에서는 32비트 CPU 시장을 계속 고수해 나가며, 보다 성능을 높이고 있는 반면, 유일한 경쟁사라 할 수 있는 AMD는 x86 기반의 새로운 64비트 CPU 시장을 개척해나가고 있다. 어떤 것이 옳고, 어떤 것이 그르다고 할 수 없는 이러한 상황에서 가장 고민하는 것은 역시 소비자일 것이다.
단순히 CPU 시장만 본다면 이런 고민이 들 수 있지만, 운영체제와 어플리케이션 프로그램들이 아직 32비트로 프로그래밍 되고 있는 현재의 시장 상황에서는 아직까지 32비트 CPU가 대세라는 것은 분명하다. AMD가 열어 놓은 64비트 시장은 앞으로 무궁한 발전 가능성이 있지만 보다 시간이 지나야 열매를 맺을 수 있을 것이다.
그렇다면 과연 지금의 선택은 32비트 CPU인가? 불과 몇 개월 전, 인텔은 펜티엄4의 새로운 버전인 펜티엄4 익스트림에디션(P4EE)을 선보였다. 지금까지 선보인 32비트 CPU 가운데 가장 강력하고 뛰어난 성능을 보여주어 경쟁사를 긴장시켰다. 하지만 값이 너무 비싸 이 제품을 개인용으로 쓴다는 것은 쉽지만은 않은 일이다.
시간이 갈수록 성능을 높여야 한다는 것은 제조사로서의 책임이며, 동시에 의무이기도 하다. 인텔은 그동안 펜티엄4의 성능에 관한 많은 고민을 했다. 이런 고민 끝에 인텔은 기존의 펜티엄4(노스우드 코어)로는 더 이상 성능을 높이는 것에는 무리가 있다고 판단한 듯 싶다. 결국 새로운 펜티엄4의 개발에 착수했으며, 그 계획은 코드명 프레스캇(Prescott)으로 착실히 진행되어왔다.
|
인텔은 CPU의 코드명으로 다양한 이름을 따온다. 프레스캇은 애리조나 중부에 있는 인구 3만6000여명의 아주 작은 도시다. 해발 1,630m의 분지에 있으며, 광산, 목축, 휴양이 주력산업이다. 또한 소방기구, 플라스틱제품, 우주항공설비 등의 제조업도 이루어지고 있다. 프레스캇은 1863년 골드러시라 불리는 금광 개발이 진행되면서 개발된 곳이다. 역사학자인 윌리엄 H 프레스캇의 이름을 따 현재의 지명이 되었다. 애리조나주의 주도를 피닉스로 옮기기 전까지 주도였기도 하다. 지금은 인텔의 새로운 펜티엄4의 코드명으로, 아마 한동안 귀가 따갑게 들을 수 있을 것이다.
| |
» 인텔의 펜티엄4 로드맵. 로드맵을 보면 펜티엄4의 세대 구분을 좀더 쉽게 할 수 있다. | 펜티엄4의 세대를 구분한다면, 코드명에 따라 1세대는 월라맷, 2세대는 노스우드, 3세대는 프레스캇이라 할 수 있다. 월라맷과 노스우드를 보면 공정이 미세해진 것과 L2 캐시 메모리가 늘어났다는 것, 일부 CPU에서 하이퍼쓰레딩을 쓸 수 있다는 것말고는 근본적으로 크게 달라진 것은 없다. 근본적으로 넷버스트 마이크로 아키텍처에는 변함이 없다.
3세대 펜티엄4라고 할 수 있는 프레스캇. 무엇이 달라졌을까? 진보된 넷버스트 아키텍처를 쓰는 프레스캇에는 많은 변화가 숨어 있다. 지금부터 프레스캇의 새로운 세계로 여행을 떠나보자.
90nm 공정을 적용한 첫 번째 CPU 프레스캇(펜티엄4와 구분하기 위해 이하 모두 프레스캇이라 칭함)에는 차세대 공정 기술인 90nm 공정으로 만들 것이다. 노스우드 코어에서는 130nm(0.13um) 공정이 적용되었기 때문에, 프레스캇은 90nm 공정이 적용된 첫 번째 CPU라 할 수 있다. 130nm 공정과 90nm 공정의 차이점부터 간단히 알아보자.
130nm |
90nm |
6 layers of copper interconnect |
7 layers of copper interconnect |
Low K SIOF(silicon dioxide) |
Low k CDO(Carbon-doped Oxides) |
코발트 규소 |
니켈 규소 |
2 u² SRAM Cell |
1 u² SRAM Cell |
248 nm lithography |
193 nm lithography |
Normal Si |
Strained Si | 프레스캇에 적용된 90nm 기술은 많은 변화가 있다. 가장 먼저 구리 배선이 6레이어(층)에서 7레이어로 높아졌다. Low K SIOF(저유전 이산화규소)에서 Low K CDO(저유전 산화카본)으로 바뀌었으며, 코발트 규소에서 니켈 규소로 바뀌었다.
| |
» 90nm로 공정이 미세해지면서 기존의 130nm 공정과는 많은 변화를 가져왔다. | 뿐만 아니라 캐시메모리로 주로 사용되는 SRAM 셀의 크기가 2 u²에서 1 u²로 작아졌으며, 248nm 리소그라피(lithography : 석판 인쇄)에서 193nm 리소그라피로 작아졌다.
위의 설명은 관련 전문 지식이 없으면 어떤 의미인지 어렵다는 생각이 들 것이다. 보다 쉽게 설명하면 미세한 공정을 사용함으로써 크기가 작아졌고, 프로세서 속도를 보다 높일 수 있는 재료로 바꾸었다는 정도로만 알면 된다. 그래픽칩셋 제조사나 CPU, 메모리 개발회사에서 엄청난 개발 비용을 들여 제조공정을 미세화하는 것도, 이런 미세화 과정을 통해 얻어지는 이득이 만만치 않기 때문이다.
| |
» 90nm로 공정이 바뀌면서 Strained Si을 적용했다. 느슨한 상태로 바뀌어 전자의 흐름을 좀더 원활하게 할 수 있어 프로세서의 속도를 높일 수 있다. | 여기서 눈 여겨 볼 것은 Normal Si(일반 실리콘)에서 Strained Si(팽창한, 간격이 있는 실리콘)으로 바뀌었다는 것이다. 이것은 실리콘의 간격을 강제적으로 늘린 실리콘을 써서 전자(Electron)의 흐름을 원활히 한 것이다. 이런 방식을 쓴다면 같은 CPU의 속도를 보다 높일 수 있는 이점이 있다.
| |
» 프레스캇은 노스우드 코어에 비해 두 배 이상의 트랜지스터를 집적해, 1억 2500만개의 트랜지스터를 집적했다. | 공정이 미세해졌다는 것은 크게 몇 가지 의미를 갖는다. 먼저 물리적으로 보다 작은 크기의 CPU를 만들 수 있다는 것과 낮아진 공정으로 인해 구동전압을 낮출 수 있어, 소비전력을 줄일 수 있다. 여기에 부가적으로 발열도 줄어든다. 이런 장점 때문에 CPU 제조사는 물론 반도체 제조사는 공정을 낮추려고 많은 노력을 하는 것이다.
SSE3으로 보다 빠르게 CPU의 성능을 높이는 방법에는 여러 가지가 있다. 가장 흔히 쓰는 방법이 단순하게 클럭을 높이는 방법이다. 또한 AMD에서 주로 쓰듯 IPC를 높이는 것도 좋은 방법이다. 하지만 같은 클럭, 같은 IPC라는 조건을 둔다면, 이 조건에서 성능을 높이는 방법은 제한적이다. 이럴 경우 써먹을 수 있는 대표적인 방법이 바로 L1, L2 캐시 메모리의 용량을 늘리는 것이다. 얼마전 선보였던 익스트림에디션이 바로 이런 방법을 썼다. 하지만 비용 문제 때문에 캐시를 무조건 늘릴 수도 없는 입장이다.
그렇다면 남은 방법은 하드웨어로 처리되는 명령어를 늘리는 것이다. MMX로 시작된 멀티미디어 명령어를 추가함으로써, 멀티미디에서 CPU의 처리 성능을 비약적으로 높였다. 뿐만 아니라 펜티엄III에 더해진 SSE, 펜티엄4에서 추가된 SSE2는 보다 강력한 멀티미디어 구현 능력을 CPU에 부과했다. 그렇기에 SSE, SSE2를 쓰지 않는 CPU는 상대적으로 느릴 수밖에 없는 것이다.
| |
» 프레스캇에 더해진 SSE3 명령어. 분야별로 몇 가지씩 추가되었다. | 프레스캇에는 13개의 명령어가 추가된 SSE3이 추가되어 보다 강력한 멀티미디어를 즐길 수 있다. 정수연산과 부동소수연산에 6개의 명령어가, 비디오 인코딩에 1개의 명령어가, 멀티미디어 관련 4개의 명령어, 하이퍼쓰레딩 관련 2개의 명령어가, 이렇게 13개의 명령어가 더해졌다.
펜티엄III에서 SSE가 더해지면서 파이프라인 역시 그에 최적화된 10단계로 설계되었다. 펜티엄4에 SSE2가 추가되면서 파이프라인은 그에 최적화된 20단계로 늘어났다. 프레스캇에 SSE3이 추가되면서 파이프라인은 30단계로 한층 늘어났다. 이는 매우 중요한 의미를 갖는다.
| |
» 프레스캇은 노스우드에 비해 부동소수연산의 성능이 개선되었으며, 보다 적은 리소스로 데이터를 처리할 수 있다. | 기대와는 달리 파이프라인의 단계가 추가된다고 무조건 성능이 좋아지는 것은 아니다. 만일 프레스캇에서 SSE2만 쓰고 30단계의 파이프라인만 쓴다면 성능은 상대적으로 이전의 펜티엄4에 비해 떨어질 수밖에 없다. 한 예로 펜티엄4가 처음 선보였을 때 상대적으로 같은 클럭의 펜티엄III에 비해 성능이 떨어진 것이 이를 잘 증명한다.
하지만 지금은 그 결과가 결코 정답이라고는 할 수 없다. 요즈음 선보이는 프로그램은 대부분 SSE2에 최적화되어 있다. 이 말은 곧 펜티엄4에 맞추어져 있다는 말로 바꿀 수 있다. 그렇기에 지금 다시 펜티엄III와 펜티엄4의 성능을 비교한다면 펜티엄4가 빠르다는 것을 누구도 부인할 수 없을 것이다. 밥도 완전히 지어지기 전에 뜸을 들이듯, 제대로 된 성능을 보이기에는 약간의 시간이 필요한 셈이다.
| |
» 프레스캇은 많은 진보된 기술이 적용되어있다. 향상된 분기 예측 기능과 전원관리 기능, 향상된 하이퍼쓰레딩 기술, SSE3 명령어 등의 기술로 보다 빠른 성능을 제공할 수 있다. | 지금 프레스캇의 상황도 비슷하다. SSE3과 30단계의 파이프라인은 분명히 진보된 기술임에 틀림없다. 하지만 제대로 쓸 수 있는 벤치마크 프로그램은 물론 프로그램조차 없는 것이 현실이다. 테스트에서도 성능을 이야기하겠지만 지금 프레스캇의 성능을 논한다는 것 자체가 그다지 큰 의미가 없다는 것이다. 프레스캇의 성능을 제대로 재단할 도구가 없기 때문이다.
머지않아 다이렉트X나 미디어 인코더와 플레이어에서 SSE3을 지원할 예정이다. 다양한 멀티미디어 관련 프로그램 제조사도 SSE3의 지원에 관심을 보이고 있다. 프레스캇의 뛰어난 성능을 보려면 적어도 지금은 아니라는 말로 대신하고 싶다.
한 단계 업그레이드 된 하이퍼쓰레딩 물리적으로 두 개의 CPU를 구현하는 것은 아니지만 마치 두 개의 CPU를 쓰는 것처럼 쓰레드를 분리해서 처리할 수 있는 하이퍼쓰레딩은 프로세서의 성능에서 많은 진보를 가지고 왔다. 특히 멀티미디어에서 성능향상은 단연 돋보이는 분야이다.
하지만 노스우드코어 기반의 하이퍼쓰레딩은 성능에서 만족스러운 모습을 보여주지 못했다. 그 원인을 분석해보면 우선 하이퍼쓰레딩을 제대로 쓰기에 512KB로는 부족한 L2 캐시 메모리를 들 수 있다. 가상 CPU라고는 하지만 분명히 두 개의 CPU로 동작하기 때문에 하나의 가상 CPU는 그에 따라 캐시 메모리도 512KB의 반인 256KB만 쓸 수 있다. 당연히 클럭이 낮은 CPU에서 하이퍼쓰레딩의 효율은 낮을 수밖에 없었다. 인텔이 낮은 클럭의 셀러론이나 펜티엄4에 하이퍼쓰레딩을 써먹지 않는 것도 이런 이유가 숨어있다.
| |
» 프레스캇은 16KB의 L1 캐시 메모리와 1MB의 L2 캐시 메모리, 800MHz의 FSB를 지원한다. 3GHz 이상 높은 클럭의 프로세서부터 출시할 예정이다. | 대안으로 나온 것이 대용량의 L3 캐시 메모리를 장착하는 것이다. 그 결과 선보인 것이 펜티엄4 익스트림에디션이다. 익스트림에디션은 분명히 최고의 성능에 보여준다. 하지만 성능에 비해 지나치게 비싼 가격은 분명히 단점으로 남아있다. 서버나 워크스테이션이라면 모를까 결코 대중적이지 못하다는 것이다.
적은 비용으로 하이퍼쓰레딩의 성능을 높일 수 있는 방법이 없을까? 답은 앞에서 말한 90nm 공정에 있다. 보다 미세해진 공정으로 같은 크기의 다이(Die)에 보다 많은 트랜지스터를 집적할 수 있다. 그렇기 때문에 보다 적은 비용으로 캐시 메모리를 늘릴 있는 여유를 확보하게 된 것이다.
| |
» 제조 공정을 낮추면 보다 많은 장점이 있다. 보다 많은 트랜지스터를 집적할 수 있고, 가격을 낮출 수 있다는 이점이 있다. | 프레스캇의 하이퍼쓰레딩 능력이 기존의 펜티엄4에 비해 다소 향상이 있다고 추측할 수 있는 것도 바로 여기에 있다. 프레스캇은 16KB의 L1 캐시 메모리와 1MB의 대용량 L2 캐시 메모리를 장착했다. 물론 하이퍼쓰레딩이 없는 CPU도 캐시 메모리가 많아지면 성능이 많이 좋아지는 것은 사실이다. 하지만 1MB의 L2 캐시 메모리는 분명히 하이퍼쓰레딩에서 더 많은 성능 향상을 가져왔다고 할 수 있다.
물론 L2 캐시 메모리만 늘어난 것으로 하이퍼쓰레딩의 성능이 좋아진 것은 아니다. 앞에서 잠시 다루었지만 SSE3에 새로이 추가된 하이퍼쓰레딩 관련 명령어가 있기 때문이기도 하다. 그래서 전체적으로 하이퍼쓰레딩의 성능이 높아진 것이다. 이것을 인텔은 진보된 하이퍼쓰레딩 기술(Advanced Hyper-Threading Technology)이라 부른다.
| |
» 90nm 공정에 사용된 50nm 트랜지스터. 이 트랜지스터는 웬만한 감기 바이러스보다 작은 크기라 할 수 있다. | 하이퍼쓰레딩은 생각보다 많은 분야에서 뛰어난 성능을 발휘한다. 특히 멀티미디어에서 그 뛰어난 성능을 확인 할 수 있는데, 흔히 볼 수 있는 디지털 사진과 동영상 편집을 들 수 있다. 게다가 하드코어 3D 게임은 물론 3D 영상 관련 컨텐츠를 제작하는데도 뛰어난 성능을 발휘한다. 디지털 음악이나 디지털 TV를 보다 쉽고 편하게 감상할 수 있는 환경을 제공하기도 한다. 가정에서 최고의 디지털 엔터테인먼트 기능을 제공할 충분한 성능을 바로 하이퍼쓰레딩이 제공할 수 있다고 해도 지나친 말이 아니다.
하지만 하이퍼쓰레딩이 무조건 성능향상을 가져 올 수 있다는 것은 잘못된 생각이다. 단순한 작업에서는 성능이 향상되었다는 것조차 느낄 수 없다. 멀티미디어 다중작업에서 그 진가를 나타낼 수 있다. 예를 들면 동영상 감상과 3D게임을 동시에 한다고 하면, 하이퍼쓰레딩으로 두 프로그램의 쓰레드를 적절히 분리해서 처리해 두 프로그램 모두 원활히 처리를 할 수 있다. 동영상 감상과 3D 게임을 모두 할 수 있다는 것이다.
결국, 하이퍼쓰레딩의 진가는 바로 다중작업에서 나타난다는 것이다. 그런 까닭에 서버나 워크스테이션에 주로 사용되는 제온(Xeon)에서는 이미 오래 전부터 하이퍼쓰레딩을 써왔던 것이다.
새로운 기술만이 전부는 아니다. 앞에서 잠시 이야기했지만 프레스캇에 적용된 전체적인 기술을 의미하는 단어가 바로 진보된 넷버스트 마이크로 아키텍처를 말한다. 위에서 프레스캇을 3세대 펜티엄4로 분류를 했는데, 아키텍처라는 다른 의미로 본다면 프레스캇은 2세대라 할 수 있다.
|
|
» 인텔에서 선보인 300mm 웨이퍼. 이로써 프레스캇을 보다 많이 생산을 할 수 있어 가격을 낮출 수 있는 경쟁력을 확보했다. |
프레스캇에 적용된 90nm 공정과 더불어 300mm 웨이퍼 기술이 적용되어 있다. 300nm 웨이퍼를 쓴다는 것은 웨이퍼 하나에 보다 많은 CPU를 생산할 수 있다는 것이다. 이로써 같은 웨이퍼에서 보다 많은 CPU를 생산할 수 있어 CPU의 가격을 낮출 수 있는 여유를 마련했다.
이번에 선보인 프레스캇은 FSB 800MHz를 공식적으로 지원하는 865 시리즈와 875P라면 모두 쓸 수 있다. 하지만 이것은 칩셋만 지원한다는 이야기다. 모든 메인보드가 그렇다는 것은 아니다. 프레스캇의 소비전력은 100W가 넘는 것으로 알려져 있다. 펜티엄도 3.2GHz가 80W 이상 소비하는 것에 비한다면 무려 20W 이상 높다는 것이다.
그러기 때문에 가장 문제가 되는 것이 다름 아닌 메인보드 전원부이다. 인텔이 권장하는 것은 VIN 1.5 규격을 만족시켜야 프레스캇을 쓸 수 있다는 것이다. 단순히 기존의 VIN 1.0 규격을 만족하는 메인보드라면 프레스캇을 쓸 수 있지만 안심하고 프레스캇을 쓰려면 VIN 1.5규격을 만족시켜야 한다.
| |
» 프레스캇을 공식적으로 지원하는 865PE 칩셋의 메인보드 | VIN 1.5 규격을 만족하지 않더라도 충분한 전력을 공급해 줄 수 있는 메인보드라면 프레스캇을 문제없이 쓸 수 있다. 하지만 전원부가 다소 떨어지는 메인보드라면 제대로 지원할지는 의문이다. 쉽게 말해 부팅조차 되지 않는 것이다. 만일 앞으로 프레스캇을 쓰려고 하거나 쓸 예정에 있다면 프레스캇이 제대로 지원되는 메인보드를 구입해야 후회가 없을 것이다.
|
|
» 인텔의 로드맵에 따르면 새로운 프레스캇이 대기중이다. 478핀에서 775핀으로 바뀌기 때문에 호환성은 없다고 알려져 있다. |
인텔의 로드맵에 따르면 2/4분기에 새로운 방식의 펜티엄4가 선보일 예정이다. 알려진 대로 775핀의 소켓 775(LGA-775)이다. 새로운 칩셋인 915시리즈와 925시리즈를 위해 단순히 핀만 늘어난 것인지 아키텍처까지 변한 것인지는 아직까지 알려져 있지는 않지만 분명한 것은 이 새로운 펜티엄4는 기존의 소켓 478과는 호환되지 않는다는 것이다. 어쩌면 소켓 478의 프레스캇은 과도기의 CPU 일지도 모른다는 생각이 든다.
프레스캇은 어떻게 생겼나 프레스캇의 성능을 알아보기 전에 프레스캇의 성능을 제대로 이끌어 낼 수 있는 벤치마크 프로그램을 찾아보았다. 다양한 자료를 찾아보았으나 프레스캇의 성능을 제대로 이끌어 내 줄 수 있는 프로그램은 찾지 못했다는 말로 벤치마크를 시작하고 싶다. 프레스캇은 지금까지 새로운 CPU라고 계속해서 강조를 해왔다. 지금부터 시작하는 테스트 결과가 프레스캇의 성능의 전부는 아니라는 것을 알고 테스트 결과를 살펴보자.
제품 사양
코드명 |
프레스캇(Prescott) |
제조공정 |
90nm(0.09um) |
FSB |
533/800MHz (533MHz는 2.8GHz만) |
동작전압 |
1.35V |
L1 캐시 메모리 |
16KB |
L2 캐시 메모리 |
1024KB |
트랜지스터 집적도 |
1억 2500만개 |
다이 크기 |
112nm² |
클럭 |
2.8/3.0/3.2/3/4 이상 |
패키지 |
mPGA478 |
특징 |
Advanced Hyper-Threading Technology, Prescott New Instructions(SSE3) support, LaGrande security technology 지원예정(아직까지는 지원 안 함) |
|
|
» 패키징은 기존의 펜티엄4와 차이점이 없다. |
테스트를 시작하기 전에 프레스캇에 대해 먼저 알아보도록 하자. 먼저 겉모습을 살펴보면 기존의 펜티엄4와 크게 다르지 않다. 패키징 방식도 FC-PGA2로 동일하다. 핀 수도 같은 487핀이므로 외형에서는 큰 차이점을 찾을 수 없다.
| |
» 왼쪽이 프레스캇이며, 오른쪽은 테스트에 사용될 펜티엄4 3.2GHz다. 앞면은 차이가 없지만 뒷면에서 프레스캇은 저항과 레지스터로 구성되어 있지만 펜티엄4는 레지스터로만 구성되어 있다. | 뒷면을 보면 흥미로운 차이를 볼 수 있는데, 펜티엄4는 단순히 레지스터로 구성되어 있는 반면, 프레스캇은 레지스터와 저항으로 구성되어 있는 것을 볼 수 있다. 기존의 펜티엄4에서는 저항이 장착된 것을 볼 수 없었다. 프레스캇에서 CPU의 구조가 다소 변경되면서 추가된 것으로 생각된다.
|
|
» CPU-Z로 알아본 프레스캇과 펜티엄4 3.2GHz의 간단한 정보. SSE3과 L1, L2 캐시 메모리가 늘어난 것을 알 수 있다. 0.13u에서 0.09u로 공정이 변한 것까지 정확히 보여준다.(왼쪽이 프레스캇, 오른쪽이 펜티엄4 3.2GHz) |
|
|
» 산드라로 알아본 프레스캇과 펜티엄4 3.2GHz의 정보. 산드라 2004 최신버전도 프레스캇의 정보를 완벽하게 인식하지는 않았다. |
프레스캇의 클럭을 보면 다소 특이한 점을 알 수 있다. FSB가 일률적이지 않고, 2.8GHz 한 제품은 533MHz라는 상대적으로 낮다. 인텔의 워크스테이션, 서버용 칩셋인 E7205는 FSB 지원이 최대 533MHz다. 아마도 이 칩셋을 배려한 것이 아닌가 생각할 수 있고, 달리 생각하면 좀 더 대중적인 제품을 함께 선보여 초기에 바람몰이를 하겠다는 전략일수도 있다.
|
|
» 인텔 메인보드의 유틸리티인 인텔 데스크탑 컨트롤 센터에서는 프레스캇을 펜티엄4로 제대로 인식한다. 또한 인텔 액티브 모니터에서는 CPU의 구동전압을 1.35V로 정확히 나타낸다. |
어쨌거나 2.8GHz말고는 모두 800MHz FSB로 출시된다. 참고로 앞으로 선보일 775핀의 프레스캇도 모두 800MHz만 선보일 예정이다.
실험 사양
CPU |
프레스캇 3.2GHz / 펜티엄4 3.2GHz |
메인보드 |
인텔 D875PBZ (i875P) |
메모리 |
커세어 DDR 433 256MB * 2 |
하드디스크 |
웨스턴디지털 랩터 WD360 (시리얼ATA / 38GB / 10,000rpm / 8MB) |
그래픽카드 |
인사이드 지포스FX 5700 256MB |
DVD롬 드라이브 |
삼성 16배속 |
전원공급장치 |
마이크로닉스 320w |
운영체제 |
윈도우즈 XP 영문 (서비스팩 1적용) | 테스트 환경을 잠시 살펴보자. 프레스캇과 같은 FSB과 클럭을 제공하는 펜티엄4 3.2GHz가 테스트 대상으로 정해졌다. 두 CPU는 노스우드와 프레스캇의 최고 성능을 보여주는 CPU로 기존의 아키텍처와 새로운 아키텍처와의 비교로 가장 적당하다고 판단되었기 때문이다.
| |
» 윈도우즈 XP SP1에서도 펜티엄4로 인식하지 않고 인텔 CPU로만 인식한다. | 메인보드는 프레스캇을 제대로 쓸 수 있는 메인보드 가운데 가장 높은 사양을 자랑하는 인텔의 875P 칩셋을 장착한 메인보드를 골랐다. 메모리는 가장 뛰어난 성능을 보여준다는 커세어 메모리를, 하드디스크는 10000RPM에 8MB의 버퍼 메모리를 장착한 웨스턴디지털의 랩터를 택했다. 그래픽 카드는 테스트 과정에서 혹시 있을지 모를 전원문제 때문에 상위기종인 FX5900 등을 쓰지 않고 이미 테스트에서 검증된 인사이드 지포스FX 5700 256MB 버전을 선택했다.
실험 1. SiSoft Sandra 2004 (CPU 성능 / CPU멀티미디어 성능 / 메모리 성능)
제일 먼저 산드라 2004로 CPU의 성능을 간단히 알아보았다. 결과는 다음과 같다.
새로운 아키텍처를 적용한 프레스캇의 성능이 당연히 잘 나올 것이라는 예측이 완전히 벗어났다. 테스트 결과를 보면 SSE2까지만 알아볼 수 있다. 그렇다면 프레스캇의 성능을 제대로 알아볼 수 없다는 것이다.
메모리의 성능은 L2 캐시 메모리가 늘어난 만큼 보다 빨라진 것을 느낄 수 있다. 산드라 2004의 메모리 성능 테스트는 CPU와 메인 메모리 사이의 성능을 테스트하기 때문에 버퍼역할을 하는 1MB의 대용량 L2 캐시는 그만큼 충분한 효과를 발휘한 것이다. 하지만 단순히 대역폭이 조금 높을 뿐 크게 차이가 나는 것은 아니라고 할 수 있다.
실험 2. PC Mark 2004
PC Mark 2004는 PC 전체의 성능을 분야별로 한눈에 알아볼 수 있는 벤치마크 프로그램이다. 그 가운데 CPU와 가장 밀접한 관련이 있는 메모리와 CPU의 성능을 알아보았다.
|
|
» PC Mark 2004의 CPU 테스트 세부항목. 대부분의 성능에서 프레스캇의 성능이 떨어지는 것을 알 수 있다. (왼쪽의 결과가 프레스캇, 오른쪽이 펜티엄4 3.2GHz) |
PC Mark 2004에서도 프레스캇이 성능이 떨어지는 결과를 보여준다. 산드라 2004의 결과가 틀린 것이 아니라는 것이다. 뛰어난 기술이 적용된 CPU임에도 불구하고 성능이 떨어지는 이유는 역시 아직까지 CPU의 성능을 제대로 이끌어낼 수 없다는 것이다.
실험 3. Tesk MPEG
동영상의 포맷을 MPEG로 바꾸어주는 대표적인 프로그램이 Tesk MPEG이다. 동영상의 포맷을 변환하는 과정에서 CPU의 사용률이 높기 때문에 벤치마크 프로그램으로 자주 쓰인다.
Tesk MPEG은 하이퍼쓰레딩을 쓸 수 있는 동영상 인코더다. 그래서 하이퍼쓰레딩의 성능과 CPU의 성능을 동시에 알아볼 수 있다. 의외로 프레스캇의 성능이 많이 떨어지는 것을 볼 수 있다. 아직까지 프레스캇을 제대로 인식하지 못한다고 하더라도 이렇게 성능이 떨어지지는 않을 것이라는 생각이 들었다.
같은 조건에서 테스트를 여러 번 해봤지만 같은 결과가 나왔다. 테스트가 잘못된 것은 아니라는 것이다. 이 테스트 결과를 잘 설명할 수 있는 벤치마크가 바로 아래 항목에 있는 시스마크 2002다. 그 결과를 보면서 성능에 대해 다시 이야기 해보자.
실험 4. 시스마크 2002
시스마크 2002는 PC 전체의 성능을 멀티미디어 분야와 오피스 분야로 나누어 보여주는 벤치마크 프로그램이다. CPU의 벤치마크에 자주 등장하는 것도 이 때문이다.
시스마크 2002의 전체 성능은 두 CPU 모두 비슷하다. 하지만 세부 결과는 의외로 다르다는 것을 알 수 있다.
먼저 멀티미디어의 성능을 알아볼 수 있는 Internet Content Creation 항목은 펜티엄4 3.2GHz가 뛰어나다. 멀티미디어 항목에서 프레스캇이 더 빠를 것이라는 예측은 보기 좋게 빗나갔다. 역시 SSE3을 지원하지 않는다면 프레스캇의 멀티미디어 성능은 펜티엄4 3.2GHz에 떨어진다는 것이다.
하지만 Office Productivity 항목에서는 프레스캇이 더 빠른 결과를 보여주었다. 단순히 오피스 프로그램을 사용한 것이고 멀티미디어 명령어를 거의 쓰지 않기 때문에 순수한 CPU의 성능은 프레스캇이 더 빠르다는 것이다. 보다 커진 L2 캐시 메모리의 영향이라고 할 수 있다.
실험 5. 3D마크 2003
그래픽 카드의 성능을 알아보는데 가장 많이 사용하는 벤치마크 프로그램 가운데 하나가 바로 3D마크 2003다. 게다가 3D는 CPU의 영향도 많이 받기 때문에 CPU의 성능을 테스트하는데도 빠지지 않는다.
다이렉트X 9.0을 지원하는 3D마크 2003은 아직까지 SSE3을 제대로 쓸 수 없다. 그렇기 때문에 지금까지의 성능테스트를 본다면 프레스캇의 성능이 떨어질 것이라는 예상과는 반대로 그 결과가 약간 높게 나왔다.
3D마크 2003은 멀티미디어 명령어의 처리 능력보다는 CPU의 연산능력에 많은 영향을 받기 때문에 이와 같은 결과가 나온 것이라고 할 수 있다. 즉, 프레스캇의 순수한 연산능력은 펜티엄4 3.2GHz와 비슷하거나 그보다 빠르다는 것이다. SSE3만 제대로 지원해준다면 보다 바른 성능을 보여 줄 수 있다는 여운을 남긴 테스트항목이다.
실험6. 3D 게임 성능 CPU의 성능을 테스트하는데 빠질 수 없는 것이 3D 게임이다. 그래픽 카드의 성능도 뛰어나야 하지만, 그에 못지 않게 CPU의 성능도 뛰어나야 하기 때문에 벤치마크에 많이 쓰인다. 최신 게임 4종을 해상도별로 프레임을 측정해보았다.
코만치4
코만치4는 다이렉트X 8.1을 지원하는 게임이다. 다이렉트X 8.1에서의 프레스캇의 성능은 과연 어떤지 살펴보자.
낮은 해상도에서는 많은 차이를 보인다. 같은 환경에서 약 5.5fps가 차이가 난다는 것은 CPU의 성능이 많이 차이가 난다는 것이다. 여기서 생각할 수 있는 것은 프레스캇은 분명히 다소 오래된 환경(운영체제 및 어플리케이션)에서 쓴다면 제 성능을 내지 못해 느릴 수도 있다는 것이다.
언리얼 토너먼트 2003
언리얼 토너먼트 2003은 두 개의 API(다이렉트X와 오픈GL)를 동시에 써먹는 것이 특이한 게임이다. 그래픽 카드와 CPU 벤치마크에 단골 메뉴로 등장하며, 성능을 알아보는데 많이 쓰인다.
낮은 해상도에서는 펜티엄4 3.2GHz가 다소 앞서는 결과를 보여준다. 하지만 고해상도로 갈수록 프레스캇과 펜티엄4 3.2GHz의 성능 차이는 줄어들고 있다. 고해상도에서 더 많은 연산을 한다는 것을 생각해본다면 전체적인 CPU의 성능이 떨어진다는 것은 아니라는 것을 알 수 있다.
아쿠아마크3
아쿠아마크는 다이렉트X 9.0을 기반으로 하는 게임으로 비교적 높은 사양을 요구하며 다양한 효과로 인한 화려한 그래픽이 특징이다. 벤치마크에 필수항목으로 자주 등장하며 CPU와 그래픽카드의 성능을 별도로 알아볼 수 있는 기능도 있다.
테스트 결과 CPU의 성능은 펜티엄4 3.2GHz가 뛰어나지만 그래픽 카드의 성능은 프레스캇이 더 뛰어나다는 것을 볼 수 있다. 하지만 전체적인 성능은 비슷한 결과를 보여준다.
툼레이더2
툼레이더는 다이렉트X 9.0을 기반으로 하는 게임이다. 높은 사양을 요구하는 게임으로 최고의 사양에서도 30프레임을 넘기기 힘들다. 프레스캇과 펜티엄4 3.2GHz는 같은 CPU라 할 수 있을 정도로 비슷한 성능을 보여주었다. 약간의 차이는 있지만 오차의 한계로 같은 성능이라 말할 수 있을 정도이다.
실험7. SPECviewperf 7.1
SPECviewperf는 오픈GL의 성능을 테스트하는 벤치마크 프로그램이다. 오픈GL은 그래픽 카드와 CPU의 연산 능력, 그리고 메모리 대역폭에 따라 성능의 차이가 많이 나는 편이다.
오픈GL은 멀티미디어 명령어 처리 능력보다는 CPU의 연산능력에 따라 많은 차이를 보인다. CPU의 연산능력은 프레스캇이 떨어지지 않는다고 지금까지의 테스트 결과가 말해주는데 의외로 오픈GL에서는 그 성능이 떨어지는 것을 볼 수 있다.
테스트 항목을 보면 비교적 단순한 3D 그래픽 랜더링에서는 비교적 차이가 큰 편이지만 복잡한 3D 그래픽 랜더링에서는 큰 차이를 보이지 않고 있다. 아직까지는 오픈GL에서도 프레스캇의 성능을 제대로 이끌어 낼 수 없다는 것이다.
테스트를 끝내고 나서 전체적으로 보면 프레스캇의 성능이 떨어진다는 결론이 나온다. 지금의 벤치마크 프로그램들이 아무리 프레스캇을 제대로 쓸 수 없다고 하더라도 일부 항목에서는 같은 클럭의 펜티엄4 3.2GHz에 비해 너무 떨어지는 것을 볼 수 있다.
그래서 많은 생각을 해보았다. 왜 성능이 떨어질까? 그러던 중 사이언스마크라는 벤치마크 프로그램이 제대로 돌아가지 않아 테스트를 했음에도 불구하고 테스트 항목이 넣지 못한 것이 기억이 났다.
|
|
» 사이언스마크의 메모리 성능 테스트. 프레스캇의 L1, L2 캐시 메모리의 성능은 알아볼 수 없었다. 즉 사이언스마크에서 CPU를 제대로 인식하지 못해 대역폭을 측정하지 못한 것이다. |
사이언스마크와 같은 CPU 메모리 벤치마크 프로그램에서 프레스캇을 제대로 인식하지 못한다면, 즉 L1, L2 캐시 메모리의 성능을 알 수 없다면 다른 벤치마크 프로그램에서도 L1, L2 캐시 메모리를 제대로 쓸 수 없지 않을까 하는 의문이 들었다. 그렇다면 전체적인 사양은 프레스캇이 펜티엄4 3.2GHz보다 높음에도 불구하고 CPU를 제대로 쓸 수 없어 성능이 떨어질 수 있다는 추측이 나온다.
물론 이것은 정답이 아니라 테스트 결과를 가지고 유추해 본 것이다. 그렇기 때문에 맞다 틀리다 할 수 있을 정도는 아니란 것이다. 하지만 이런 결론이 정답이라면 캐시 메모리를 제대로 쓸 수 있는 패치나 CPU 드라이버가 나와야 할지도 모른다는 생각이 들었다. 시스템 정보에서 프레스캇을 제대로 인식하지 못하는 것을 보면 어쩌면 정답일지도.
이런 가설을 가지고 위의 벤치마크 이외에 몇 가지 테스트를 해보았다. 어쩌면 의외의 결과라고 할 수도 있기 때문에 지금부터 그 결과만 간단히 알아보도록 하자
■ 만일 프레스캇을 제대로 인식한다면
| |
» 펜티엄4E로 정확히 인식하는 AIDA32의 최신버전 | 앞에서 이미 다룬 벤치마크 프로그램은 프레스캇을 인식할 수 없어 느리다는 이야기를 했다. 이것을 증명하려면 프레스캇을 제대로 인식하고 그 성능을 알아볼 수 있는 벤치마크 프로그램이 있어야 한다.
많은 자료를 찾아보았지만 특별히 알려진 벤치마크 프로그램은 없었다. 하지만 해외사이트에서도 어쩌다 한번씩 등장하는 몇 가지 벤치마크 프로그램들이 프레스캇을 제대로 지원한다는 이야기를 듣고 그 결과를 살펴보자.
|
|
» 루비마이크로의 시스마크 2002 에디션. 잘 알려진 벤치마크 프로그램은 아니지만 시스템의 성능을 알아볼 수 있는 벤치마크 프로그램이다. 그 결과를 보면 지금까지의 결과와는 다른 것을 알 수 있다.(왼쪽이 프레스캇, 오른쪽이 펜티엄4 3.2GHz) |
루비마이크로의 시스마크 2002 에디션의 결과를 보면 프레스캇의 성능이 펜티엄4 3.2GHz의 성능을 월등히 앞선다고 할 수 있다. 프레스캇을 제대로 인식하면 다른 벤치마크 프로그램도 프레스캇의 성능이 더 잘 나올 것이라는 가설의 첫 번째 증명은 이것으로 시작되었다.
|
|
» 사이언스마크의 최신버전. L1/L2 캐시 메모리가 늘어난 만큼 캐시 메모리의 응답속도가 빨라졌다. 이것은 보다 많은 데이터를 처리할 수 있다는 것이다, |
사이언스마크의 최신버전으로 다시 테스트를 해보았다. 여전히 L1/2 캐시메모의 대역폭을 측정이 불가능했지만 캐시메모리의 응답속도는 알아볼 수 있었다. 먼저 올린 사이언스마크의 캐시메모리 응답속도를 보면 프레스캇이 펜티엄4 3.2GHz에 비해 비슷하거나 떨어지는 결과를 보여주었다. 하지만 최신 버전에서는 캐시메모리의 응답속도가 월등히 향상된 것을 알 수 있다. 프레스캇을 제대로 인식했기 때문이다. 혹시 잘못되었을지도 모른다는 생각에 CPU-Z로 캐시 메모리의 응답속도를 다시 측정해보았다.
|
|
» 최신 버전의 CPU-Z, 캐시메모리 응답속도를 측정할 수 있는 기능이 있다. 프레스캇을 제대로 인식하기 때문에 다소 성능이 향상된 것을 알 수 있다. |
CPU-Z의 캐시메모리 응답속도 테스트에서도 프레스캇의 성능이 조금 빨라진 것을 보여주었다. 그렇다면 지금의 벤치마크 프로그램들이 프레스캇의 캐시메모리를 제대로 쓸 수 없다는 것이 어느 정도 증명된 것이다.
이런 몇 가지 벤치마크 프로그램을 가지고 전체적인 성능을 이야기한다는 것은 무리가 따른다는 것은 잘 알고 있다. 하지만 프레스캇의 성능이 펜티엄4 3.2GHz의 성능보다 더 빨라질 수 있는 여유를 확인했다는 정도만 알아두자. 성능 문제는 역시 시간이 해결해 줄 것이라 생각이 든다.
■ 역시 온도문제는 해결해야할 과제
프레스캇의 소비전력 문제는 이미 많이 알려진 사실이다. 여기서 제대로 알고 가야할 문제가 있다. 프레스캇의 제조 공정이 130nm에서 90nm로 바뀌었다, 그래서 구동 전압도 1.5V에서 1.35V로 낮아진 것이다. 즉, 10%의 전압이 낮아진 것이다. 만일 90nm를 적용하고 같은 트랜지스터를 집적했다고 한다면 전압이나 전류 다 낮아지는 것이 정상이다.
하지만 트랜지스터의 개수는 5900만개에서 1억2500만개로 늘어났다. 트랜지스터가 늘어난 만큼 소비하는 전류는 늘어났다. 그래서 전압과 전류의 곱으로 표현되는 소비전력이 늘어난 것이다. 소비전력이 늘어났다는 것은 그만큼 손실도 늘어났다는 것이다. 손실은 바로 열로 연결된다.
| |
» 프레스캇과 펜티엄4 3.2GHz의 온도 비교.(위쪽이 프레스캇, 아래쪽이 펜티엄4 3.2GHz) | 프레스캇과 펜티엄4 3.2GHz의 온도를 알아보기 위해 테스트를 해보았다. 인텔의 875P 메인보드에는 인텔 데스크탑 컨트롤 센터라는 전용모니터링 프로그램이 있다. 시스템의 상태을 한눈에 알 수 있다. 먼저 산드라 2004의 번인테스트를 20분간 동작시킨 다음 온도변화를 알아보았다.
같은 환경에서 CPU의 온도만 본다면 약 21도 정도 차이가 있다. 프레스캇의 온도가 훨씬 높다는 것이다. 프레스캇의 발열 문제는 역시 루머만은 아니라는 것이다. 요즘은 크기가 작은 슬림 PC가 인기를 끌고 있다. 슬림 PC에서 프레스캇을 제대로 쓰기 위해서는 이 열 문제를 해결하지 않는다면 큰 난관에 봉착할 수 있을지도 모른다는 느낌이 든다.
■ 프레스캇 레디?
요즘 나오는 865 시리즈 칩셋의 메인보드를 보면 프레스캇 레디(Prescott Ready)라는 문구를 볼 수 있다. 이전에 나왔던 메인보드는 프레스캇을 쓸 수 없다는 말인가? 865 시리즈 칩셋은 전부 프레스캇을 쓸 수 있다고 한다. 그렇다면 역시 앞에서 말한 것과 같이 전원부에 따라 프레스캇을 쓸 수 있고, 쓸 수 없을 수 있다는 말이다. 결국 프레스캇 레디는 프레스캇을 제대로 지원할 수 있는 전원부를 갖추고 있다는 말이다.
프레스캇 레디라는 문구가 없는 메인보드는 프레스캇을 쓸 수 없단 말일까? 전원부가 넉넉한 메인보드라면 프레스캇을 지원할 것이라는 생각이 들었다. 하지만 결과는 의외였다. 테스트에 사용된 메인보드 가운데 프레스캇 레디라는 문구가 없는 모든 메인보드는 부팅이 되지 않았다. 프레스캇을 지원하지 않는다는 것이다.
혹시 앞을 염두에 두고 865 시리즈 칩셋의 메인보드를 장만한다면 꼭 프레스캇 레디라는 문구가 있는 메인보드를 구입하길 바란다.
진정한 프레스캇의 실력을 보기 위해서는 좀 더 시간이 필요할 듯 테스트 결과만 보면, 지금 당장은 프레스캇의 성능이 뛰어나다고 할 수는 없다. 마치 펜티엄4가 처음 선보였을 때 펜티엄III에 비해 성능이 크게 향상되지 않아 말이 많았던 것과 같은 양상을 보인다.
| |
» 지금은 같은 클럭의 펜티엄4에 비해 성능이 떨어지는 부분도 있지만 시간이 지나면 제대로 된 성능을 보여줄 것을 의심치 않는다. | 하지만 시간이 지나 대부분의 어플리케이션이나 벤치마크 프로그램들이 펜티엄4를 지원하면서 그 성능은 다시 한번 제대로 평가를 받았다. 프레스캇도 마찬가지가 되지 않을까 하는 생각이 든다.
|
|
» 775핀의 프레스캇은 기존의 펜티엄4와는 많이 다른 모습을 보여준다. 패키징 방식도 BGA(Ball Grid Array) 방식으로 바뀌기 때문에 메인보드에 장착하는 방식도 바뀔 것으로 보인다. |
앞으로 펜티엄4의 플랫폼이 바뀔 예정이다. 478핀에서 775핀으로 바뀐다고 하면 칩셋에서 메모리, 버스까지 전부 바뀌는 셈이다. 프레스캇은 그 때를 염두에 두고 출시되지 않았을까 하는 생각이 든다.
| |
» 915/925 시리즈 칩셋이 나오면 플랫폼에서 많은 변화가 있을 것이다. 그때쯤이면 제대로 된 프레스캇의 성능을 이끌어 낼 수 있을 것이다. |
| |
» 앞으로 선보일 DDR-II 메모리. 새로 선보일 칩셋과 호흡을 맞출 예정이다. | 775핀의 프레스캇과 915/925 시리즈 칩셋, DDR-II 메모리, PCI 익스프레스가 제대로 나올 때면 SSE3을 제대로 써먹을 수 있을 것이다. 그때 다시 한번 벤치마크를 한다면 지금과 같은 결과는 보여주지 않을 것이라는 생각이 든다.
프레스캇, 지금까지의 성능이 전부라고 한다면 그것은 잘못된 생각일 가능성이 매우 높다. 펜티엄4는 이미 한계까지의 성능을 보여주고 있지만 프레스캇의 잠재력은 아직은 많이 있기 때문이다. 프레스캇의 성능을 제대로 활용할 수 있을 때 다시 한번 벤치마크를 해보고 싶다는 것으로 이번 벤치마크의 끝맺음을 하려한다.
|
|
|
|
|