|
3300X, 3100이 출시된지 반 년이나 지난 해묵은 얘기지만
아직도 맹목적으로 찬양하는 사람들이 있어서 답답한 마음에 꺼냅니다...
AMD 신제품 3100 , 3300X를 3500X와 비교해본다! ( CCX 단일 구조의 장점)
https://www.youtube.com/watch?v=3PGq6tdhygo
신성조님 녹방에서 보시다시피
똑같은 4 GHz라도 3300X가 3100보다 더 높은 성능인건 테스트를 통해 밝혀진 사실입니다.
물론 대부분은 성조님 녹방이 아닌 다른 곳에서 들은 사실이겠지만
똑같은 클럭 속도로 맞춰도 성능 격차가 발생하는 원인을 십중팔구 CCX 위주로만 거론한 것 때문에
이를 보고 들은 사람들 중에 성능 격차 원인을 CCX만 생각하는 것도 모자라
다른 요인 안 보고 1CCX만 무조건적으로 찬양하는 사람들이 속출하기 시작했습니다.
1CCX 만능론자들이 주장하는 논리를 확장하자면
'같은 코어 개수일 때 CCX 개수가 적을 수록 좋다'가 되겠는데
과연, 다른 요인 없이 오로지 CCX 구조 때문만일까요?
성조님께서 분명 CCX 구조만을 설명한 것은 아니고, L3 캐시 메모리 구성도 함께 설명해주셨지만
어쩌면 시청자들 중에서도 그걸 제대로 못 시청하고 CCX만 기억해서
지나치게 찬양하는 사람들이 있을지도 모릅니다...
3300X를 통해 CCX라는 말을 처음 알게된 사람들이 많겠지만,
CCX 구조에 따른 성능 비교 테스트는 예전에도 있었습니다.
Ryzen CCX Performance: 2+2 vs. 4+0
https://www.youtube.com/watch?v=Rhj6CvBnwNk
1세대 라이젠 시절의 게임 성능만 비교한 영상이지만,
1800X를 가지고 똑같은 4 GHz에 3300X처럼 4+0코어로 맞췄을 때랑
1500X, 1400, 3100처럼 2+2코어로 맞췄을 때를 비교한 것인데
결과는 게임 성능 격차가 대체로 미미한 편입니다.
특정 게임만 3.2~3.4 % 정도의 격차일 뿐이죠. 왜 그럴까요?
1800X를 가지고 코어 비활성화를 통해 비교한 것이라서
2+2코어의 L3 캐시 메모리 용량이 4+4 MB가 아니라 '8+8 MB'라는 것입니다.
이러한 L3 캐시 메모리 구성 때문에
렌더링 또는 인코딩 작업보다 멀티스레딩을 잘 지원하지 못 하는 게임에서도 별 차이가 없다고 볼 수 있습니다.
단, 추가 유의 사항은
2017년 당시 Windows 10의 OS 자체 스케줄러가 좋지 않은 상태였다는 점,
2+2코어이면서 L3 캐시 4+4 MB인 CPU는 1400이 있지만,
테스트 당시에는 1800X, 1700X, 1700만 판매 중인 상태였음을 감안할 필요가 있습니다.
4GHz CPU Battle: Ryzen 3900X vs. 3700X vs. Core i9-9900K
https://www.techspot.com/article/1876-4ghz-ryzen-3rd-gen-vs-core-i9/
그 테스트로부터 2년 9개월이 지난 2019년 말 시점에서의 테스트는 어떨까요?
역시 똑같은 4 GHz로 맞추고
본래 구성 그대로인 1CCD 2CCX 4+4코어, L3 캐시 16+16 MB의 3700X랑
2개의 4코어 칩렛으로, 그러니까 2CCD 1+1CCX 4+0+4+0코어, L3 16+0+16+0 MB로 비활성화된 3900X와 비교한 것인데
결과는 렌더링 또는 인코딩 작업 성능의 경우 특정 툴만 2.8 % 격차인 것 빼고 대부분 격차가 거의 없었던 반면,
게임 성능의 경우 최소 1 %, 최대 4 %로 대부분 3 % 내외의 격차로 나타났습니다.
놀라운 점은 그 격차에서 렌더링 또는 인코딩 작업에서만 3700X가 우위이고
게임에서는 일부러 '코어 일부가 비활성화된 3900X가 우위'였다는 것입니다.
비록, 1CCX 4코어 vs 2CCX 4코어가 아닌,
1CCD 8코어 vs 2CCD 8코어 구조끼리 비교한 테스트지만
CCX, CCD라는 단위만 다를 뿐 같은 맥락의 비교입니다.
2년 9개월 전 테스트와 다르게 유의해야 할 점은 CCX 구조만이 아니라
Windows 10의 스케줄러 개선,
Zen2 마이크로아키텍처 자체의 코어간 레이턴시 개선 (레이턴시 패널티 완화),
그리고 Zen2 마이크로아키텍처에서 확 달라진 코어↔I/O간 통신 구조입니다.
Inter-core data Latency
https://www.reddit.com/r/Amd/comments/calue1/intercore_data_latency
해외 커뮤니티 사이트인 레딧에 있는 코어간 레이턴시 표를 보면
2세대 라이젠과 3세대 라이젠의 코어간 레이턴시,
덤으로 인텔 9세대 코어 i9의 코어간 레이턴시도 첨부되어 있습니다.
Zen2에서 코어와 I/O가 별도의 다이로 분리되었음에도
코어간 레이턴시가 Zen+ 대비 20~30%나 개선되었다는 것입니다.
거기에 OS 스케줄러까지 개선되었으니
CCX 구조가 다르더라도 성능 격차가 유의미하게 나타나지 않거나,
과거의 테스트와 상반된 결과가 나오지 않았나 생각합니다.
이처럼 CCX 구조에 따른 성능 차이를 논할 때
코어와 인접된 L3 캐시 메모리의 구성을 비롯해서 여러 특성들과 함께 보고 판단해야 합니다.
사실 똑같은 4 GHz에서 3300X와 3100의 성능 비교는
몇 달 먼저 나왔던 3500X와 3500의 똑같은 4 GHz에서 성능 비교와 비슷한 성능 격차 요인입니다.
이들이 나왔을 시기가 Windows 10 최신 버전이 1909였기 때문에 OS 스케줄러 능력과
CPU 마이크로아키텍처 자체, 코어와 I/O의 분리된 구성이 동일한 조건이므로
남은 비교 요소는 L3 캐시 메모리 구성밖에 없기 때문입니다.
그러니 4 GHz로 똑같이 맞춰도 3300X가 3100보다 잘 나온 이유를
CCX라고만 대답하는건 복수답변형 문제에서 하나만 맞는 불완전한 답변인 것입니다.
근거가 틀렸다가 아니라, 근거가 '부족'하다는 뜻입니다.
3300X와 3500X의 성능 비교에 관한 생각은 따로 다루겠습니다.