Zen2의 캐시 메모리 레이턴시, 대역폭, 적중률은 인텔한테 딱히 꿀릴게 없다

누가 클럭을 똑같이 맞춰도 Zen2의 게임 성능이 인텔보다 여전히 떨어지는 이유가메모리 레이턴시라고 우기는데 틀린 주장입니다. 캐시 메모리 레이턴시에도 어떤 조건에서 어떤 식으로 접근하냐에 따라 다르고캐시 메모리 대역폭도 어떤 데이터 타입(자료형)에서 어떤 식으로 처리하냐에 따라 다르지만일일이 비교하기엔 너무 복잡하므로 그래프를 통해 대략적으로 비교하자면 <img src="https://t1.daumcdn.net/cfile/cafe/993BC6485EBBE3681E" class="txc-image" actualwidth="1024" hspace="1" vspace="1" border="0" width="1024" exif="{}" data-filename="anandtech Cache Latency vs Intel.png" style="clear:none;float:none;" id="A_993BC6485EBBE3681E5CF9"/> 이미 Zen+에서 인텔을 어느 정도 따라잡았고<a href="https://www.anandtech.com/show/12625/amd-second-generation-ryzen-7-2700x-2700-ryzen-5-2600x-2600/3" target="_blank" rel="noopener noreferrer" class="tx-link">https://www.anandtech.com/show/12625/amd-second-generation-ryzen-7-2700x-2700-ryzen-5-2600x-2600/3</a> <img src="https://t1.daumcdn.net/cfile/cafe/999D53485EBBE3DC30" class="txc-image" actualwidth="676" hspace="1" vspace="1" border="0" width="676" exif="{}" data-filename="anandtech lat2700log.png" style="clear:none;float:none;" id="A_999D53485EBBE3DC30DBF5"/> <img src="https://t1.daumcdn.net/cfile/cafe/9952F5485EBBE3DC1E" class="txc-image" actualwidth="676" hspace="1" vspace="1" border="0" width="676" exif="{}" data-filename="anandtech lat3900log.png" style="clear:none;float:none;" id="A_9952F5485EBBE3DC1E268B"/> <img src="https://t1.daumcdn.net/cfile/cafe/996CA5485EBBE3DC0D" class="txc-image" actualwidth="676" hspace="1" vspace="1" border="0" width="676" exif="{}" data-filename="anandtech lat9900log.png" style="clear:none;float:none;" id="A_996CA5485EBBE3DC0D6C87"/> <img src="https://t1.daumcdn.net/cfile/cafe/99616A475EBBE42816" class="txc-image" actualwidth="676" hspace="1" vspace="1" border="0" width="676" exif="{}" data-filename="anandtech bw2700.png" style="clear:none;float:none;" id="A_99616A475EBBE428162472"/> <img src="https://t1.daumcdn.net/cfile/cafe/99F87E475EBBE42818" class="txc-image" actualwidth="676" hspace="1" vspace="1" border="0" width="676" exif="{}" data-filename="anandtech bw3900.png" style="clear:none;float:none;" id="A_99F87E475EBBE4281860B4"/> <img src="https://t1.daumcdn.net/cfile/cafe/99236E475EBBE42906" class="txc-image" actualwidth="676" hspace="1" vspace="1" border="0" width="676" exif="{}" data-filename="anandtech bw9900.png" style="clear:none;float:none;" id="A_99236E475EBBE42906658B"/> <img src="https://t1.daumcdn.net/cfile/cafe/994ADA385EBBE68213" class="txc-image" actualwidth="676" hspace="1" vspace="1" border="0" width="676" exif="{}" data-filename="anandtech mlp3900.png" style="clear:none;float:none;" id="A_994ADA385EBBE6821340C9"/> <img src="https://t1.daumcdn.net/cfile/cafe/9977CF385EBBE6831C" class="txc-image" actualwidth="676" hspace="1" vspace="1" border="0" width="676" exif="{}" data-filename="anandtech mlp9900.png" style="clear:none;float:none;" id="A_9977CF385EBBE6831CFA9F"/> Zen2에서는 일부 영역에서 인텔을 능가하기도 합니다.<a href="https://www.anandtech.com/show/14605/the-and-ryzen-3700x-3900x-review-raising-the-bar/2" target="_blank" rel="noopener noreferrer" class="tx-link">https://www.anandtech.com/show/14605/the-and-ryzen-3700x-3900x-review-raising-the-bar/2</a> 메모리 병렬 처리 능력도 Zen2가 인텔보다 대체로 더 우수한 편으로 나옵니다.캐시 미스가 발생했을 경우 메모리 병렬 처리 능력을 통해얼마나 손실을 매꿀 수 있는 능력인가를 판별하는 지표인데멀티코어, 멀티스레드 CPU 시대에 맞게 추가로 요구되는 성능 지표라고 보면 됩니다. 하지만, 캐시 메모리 레이턴시와 대역폭만 빠르면 장땡이 아닙니다.캐시 적중률을 높여야 하죠. 반대로 말하면 캐시 미시 레이트를 낮춰야 합니다. <img src="https://t1.daumcdn.net/cfile/cafe/990BBF385EBBE5B92C" class="txc-image" actualwidth="625" hspace="1" vspace="1" border="0" width="625" exif="{}" data-filename="AMD 캐시 미스율1.PNG" style="clear:none;float:none;" id="A_990BBF385EBBE5B92C80EE"/> <img src="https://t1.daumcdn.net/cfile/cafe/993714385EBBE5B923" class="txc-image" actualwidth="628" hspace="1" vspace="1" border="0" width="628" exif="{}" data-filename="AMD 캐시 미스율2.PNG" style="clear:none;float:none;" id="A_993714385EBBE5B9233EEE"/> 먼저 서버용 CPU별 L3 캐시 적중률 비교입니다.<a href="https://blog.cloudflare.com/impact-of-cache-locality" target="_blank" rel="noopener noreferrer" class="tx-link">https://blog.cloudflare.com/impact-of-cache-locality</a>캐시 미스 레이트가 낮은 실험과 높은 실험 두 가지로 비교했다고 나와 있는데둘 다 Zen2가 더 우수한 결과로 나왔습니다. 물론 그 인텔 CPU가 서버용 CPU라서 못 믿는 사람들이 있을까봐 덧붙여 일러두자면일반 데탑용 CPU의 L3 캐시 메모리 용량은 코어당 2 MB에 inclusive(포괄적) 캐시 정책,서버용 CPU의 L3 캐시 메모리 용량은 코어당 1.375 MB에 exclusive(배타적) 캐시 정책이라는 차이점이 있고 <img src="https://t1.daumcdn.net/cfile/cafe/99244C3E5EBBE5DA24" class="txc-image" actualwidth="888" hspace="1" vspace="1" border="0" width="888" exif="{}" data-filename="인텔 캐시 적중률1.PNG" style="clear: none; float: none;" id="A_99244C3E5EBBE5DA24A58B"/> <img src="https://t1.daumcdn.net/cfile/cafe/99B6253E5EBBE5DB20" class="txc-image" actualwidth="895" hspace="1" vspace="1" border="0" width="895" exif="{}" data-filename="인텔 캐시 적중률2.PNG" style="clear: none; float: none;" id="A_99B6253E5EBBE5DB2085E5"/> 안 그래도 인텔이 2019년 E3 행사에서i9-9900K의 캐시 메모리 적중률 측정 자료를 직접 공표했기 때문에<a href="https://pcper.com/2019/06/intel-gaming-performance-ryzen-3000" target="_blank" rel="noopener noreferrer" class="tx-link">https://pcper.com/2019/06/intel-gaming-performance-ryzen-3000</a>그 자료를 근거로 삼아서 비교해봐도Zen2가 여전히 더 우수한 캐시 메모리 적중률을 보여준다고 짐작할 수 있습니다. 참고로 Zen2는 일반 데탑용, 서버용 둘 다캐시 메모리 구조가 같기 때문에 적중률도 서로 똑같다고 보면 됩니다.캐시 정책도 배타적 캐시 정책의 하위 개념인 victim(희생양) 캐시 정책이기도 하고요 캐시 정책에 대해 잘 모르는 분들을 위해 위키백과에 남겨두겠습니다. (영알못인 분들에게는 구글번역기로...)<a href="https://en.wikipedia.org/wiki/Cache_inclusion_policy" target="_blank" rel="noopener noreferrer" class="tx-link">https://en.wikipedia.org/wiki/Cache_inclusion_policy</a><a href="https://en.wikipedia.org/wiki/Cache_(computing)#WRITE-BACK" target="_blank" rel="noopener noreferrer" class="tx-link">https://en.wikipedia.org/wiki/Cache_(computing)#WRITE-BACK</a><a href="https://en.wikipedia.org/wiki/Victim_cache" target="_blank" rel="noopener noreferrer" class="tx-link">https://en.wikipedia.org/wiki/Victim_cache</a> 결론은 Zen2의 캐시 메모리 레이턴시, 대역폭, 적중률, 병렬 처리 능력이인텔보다 딱히 떨어지지 않는다 입니다.단, Zen2가 인텔한테 확실히 밀리는 부분은 메인 메모리(DRAM) 레이턴시입니다.L1 캐시 메모리 대역폭도 살짝 아쉽지만...

카페정보

신성조의 견적소

다이아 (공개)
카페지기 신성조
회원수 75,098
방문수167
카페앱수110

카페 전체 메뉴

▲

지난주 BEST회원

다음▶

방문
1. 1. 흰동가리7
2. 2. jun27
3. 3. 제다이227
4. 4. 쩡워니7
5. 5. 세레나데7
1. 6. 바라이트7
2. 7. 엘리오7
3. 8. 영팍92757
4. 9. GJGJ허허7
5. 10. 산소공7
6. 11. .LDG7
7. 12. 치케7
8. 13. 신성조립컴_컹컹7
9. 14. 컴알못20대7
10. 15. 충북II개장수7
11. 16. 정빛나래7
12. 17. 씨엘로7
13. 18. 홍석일7
14. 19. 이석연7
15. 20. 밤엔7
16. 21. POUR7
17. 22. 박세웅7
18. 23. 크로우7
19. 24. 이종호7
20. 25. 초가스7
21. 26. whtieday6
22. 27. 신성조6
23. 28. 권순호6
24. 29. 호정6
25. 30. J___6
26. 31. 재림이6
27. 32. 브로콜리6
28. 33. 호메로스6
29. 34. 컴퓨터킹왕초보6
30. 35. 대도시남자6
31. 36. 범준골6
32. 37. 파릇파릇 감성6
33. 38. 카르마성6
34. 39. 울산부자6
35. 40. 라라랜드로간다6
36. 41. 임미롤6
37. 42. 싱크로400퍼6
38. 43. 초코바6
39. 44. bmoi6
40. 45. 바스스6
41. 46. 컴퓨터여퍼6
42. 47. 지모6
43. 48. 찰리스누피6
44. 49. 두치와뿌꾸(2)6
45. 50. 행크아론6
게시글
댓글

지난주 BEST회원

방문
게시글
1. 1. whtieday8
2. 2. 흰동가리6
3. 3. 신성조5
4. 4. jun25
5. 5. 권순호5
1. 6. 제다이225
2. 7. 쩡워니5
3. 8. 호정4
4. 9. 세레나데4
5. 10. 모아드24
6. 11. 피낫3
7. 12. 비웅쓰3
8. 13. 수리부엉이!3
9. 14. 홍준수3
10. 15. 나르는바위3
11. 16. Petro3
12. 17. 리버풀빅클롭3
13. 18. 바라이트3
14. 19. 예술부장K3
15. 20. 짬짜미3
16. 21. J___2
17. 22. Leki2
18. 23. 재림이2
19. 24. 정관휘2
20. 25. 횰횰2
21. 26. 브로콜리2
22. 27. 트페05182
23. 28. 용인monkey2
24. 29. bvcxz2
25. 30. 호메로스2
26. 31. 양파다2
27. 32. 용범2
28. 33. 푸딩딩2
29. 34. 광혁932
30. 35. 동충하초2
31. 36. 엘리오2
32. 37. 리동초이2
33. 38. 해달이2
34. 39. 영팍92752
35. 40. 컴퓨터킹왕초보2
36. 41. flawless2
37. 42. 혜지아빠2
38. 43. 플러스건2
39. 44. 동미니언2
40. 45. maparam2
41. 46. 정찬우2
42. 47. 싱싱2
43. 48. Skarora2
44. 49. yomjin2
45. 50. 경덕2
댓글

지난주 BEST회원

방문
게시글
댓글
1. 1. 신성조345
2. 2. 신성조립컴_컹컹9
3. 3. 신성조립컴 허밋힘9
4. 4. 흰동가리8
5. 5. J___6
1. 6. 호정4
2. 7. Leki4
3. 8. 재림이4
4. 9. M_BRIGHT4
5. 10. 이상호입니다4
6. 11. 용이용이4
7. 12. 로보4
8. 13. 마술나무4
9. 14. jun23
10. 15. 피낫3
11. 16. 정관휘3
12. 17. 횰횰3
13. 18. 브로콜리3
14. 19. 트페05183
15. 20. 안빈낙도(락귀어2)3
16. 21. 홍정환3
17. 22. 세레나데2
18. 23. 비웅쓰2
19. 24. 용인monkey2
20. 25. bvcxz2
21. 26. 호메로스2
22. 27. 양파다2
23. 28. 용범2
24. 29. 푸딩딩2
25. 30. 빙그레빙빙2
26. 31. 풋풋한사과2
27. 32. 즐거운하루abc2
28. 33. 윤귀태2
29. 34. 시린2
30. 35. 닉네임12
31. 36. 진격의소인2
32. 37. 조호진2
33. 38. 방쇼2
34. 39. 해피도그2
35. 40. gntiger2
36. 41. 컴알못20대2
37. 42. 달달선생2
38. 43. whtieday1
39. 44. 권순호1
40. 45. 모아드21
41. 46. 수리부엉이!1
42. 47. 홍준수1
43. 48. 광혁931
44. 49. 동충하초1
45. 50. 엘리오1

회원 알림

다음▶

방문▼
1. ㆍ lysosome
2. ㆍ 마루
3. ㆍ 버거컴
4. ㆍ 건선지우
5. ㆍ 광교사는남자
1. ㆍ Silver_K
2. ㆍ 미소스피드
3. ㆍ 2025올해컴터바꾼..
4. ㆍ 지구거주중
5. ㆍ 킹왕짱원석님
가입▼

회원 알림

다음▶

방문▼
가입▼
1. ㆍ 남섭
2. ㆍ 남인우
3. ㆍ 라플라타
4. ㆍ 구동
5. ㆍ 마투니
1. ㆍ 난널원해
2. ㆍ 마도사m
3. ㆍ 마루쓰
4. ㆍ 바보둘
5. ㆍ 라롤

카페 게시글

잡담 Zen2의 캐시 메모리 레이턴시, 대역폭, 적중률은 인텔한테 딱히 꿀릴게 없다

6four 추천 0 조회 122 20.05.13 21:20 댓글 7

게시글 본문내용

다음검색

저작자 표시 컨텐츠변경 비영리

홍정환
20.05.13 21:33

첫댓글 워우 뭔그래프가 이리많아 ㅠ
6four
작성자 20.05.13 21:34

비교할 요소가 많다보니 자료가 많아져서 그랬어요... 안 올리면 못 믿을 것 같아서요
캠리사
20.05.13 23:05

공감합니다 ^^
신성조
20.05.14 01:45

그래프가 많고 영문이라=ㅅ=).. 영어가 약한 저는 제대로 알아보기가 좀 어렵네요

일단 제가 아는 한도내에서 말씀드림

- 레이턴시는 별의미가 없다 (케시용량이나 분기예측(여기에는 캐시 적중율이 포함)적중율을 높여 커버할수있음)

- 캐시 미스도 -> 프리패쳐로 어느정도 해결된다는데 이건 자세는 몰라서 적당히 생략(파이프 라인을 비우는 대신 일부를 프리페치로 미스난걸 매움 정도로 알고있음)

- 대충 윗글도 그래프는 캐시 대역폭은 인텔대비 암드가 좀 빠른걸로 보이는데 일부 케시나 메모리쪽 대역폭은 엎치락 뒤치락해보임

- 거기에다가 용량을 늘린 캐시덕에 대역폭이나 레이턴시쪽도 해결됐으면 결국 남아있는건

속도가 맞먹는데 (그래프 보면 대역폭 레이턴시

1) 인피니티 패브릭 때문
2) 분기예측 차이?
3) 적중율 차이 -> 이중에서 제가 적중율 차이를 강조한게 걸려서 올리신 자료같은데 같은 캐시 용량에서 적중율은 분명히 amd가 쳐집니다 (이거 생방에서도 이렇게 이야기했을탠데) 다만 이번에 게임캐시라면서 강조한 이유가 그 낮아진 적중율을 용량을 때운겁니다 상기 자료도 그 기준이구요 결국 같은 용량기준일대 캐시 적중수치가 따라가야 동일한 적중율이라 볼수
신성조
20.05.14 01:48

머 분기예측은 아예 자료 공개를 안하니 확인안되고

인피니티 패브릭측 문제는 예전에 자료본 기억이 좀 가물가물하지만 실성능에서는 1%남짓 게이밍에서만 게임 종류별로 0~10%까지 차이가 난다고 하죠-ㅅ-);;

결국 암드가 캐시 적중율이 인텔급이었으면 2배의 용량으로 아무리봐도 IF걸로 손해봐도 밀려서는 안되는 구조라고 봅니다 (IPC도 다 따라온 현시점에서 2배의 캐시를 때려박고 속도도 비슷한데 게이밍성능에서 IF만으로 쳐진다.. 이건 이번 실험에 7700K=3300X 가 되는 시점부터 (여기는 IF의 방해를 거의안받죠 1CCX구조라) 2배의 캐시에 좀더 높은 IPC로 ... 맞먹어 버린게 된게 아마 그 단적이 예가 될수있다고 봅니다
신성조
20.05.14 01:54

https://blog.cloudflare.com/impact-of-cache-locality/

케시 적중율에 대해서 보여준 요 블로그 가보니 2배정도 인텔대비 빠른데..

얘네들 캐시용량차이가 L3기준으로 보면

33 대 256이에요 (256이 AMD측) 여기 결론에서도 캐시 용량이 커서 적중율은 잡은 상태 라고 합니다

생방에서 제가 이야기한게 기본 조건이 동일한 용량에서 AMD의 캐시 적중율이 떨어져서 용량을 키우고 적중율을 잡은형태라 맨날 캐시 적중이 개선가능하다 IF 패브릭만으로 그리 차이안난다 =ㅅ= 그러는것..

그래서 결론은머 아직 AMD는 발전 할수있는 폭이 크다 정도?
CCX 구조, 캐시 적중, (분기예측은 인텔대비 안밀린다는데 자료가없어서 생략) 더높은 클럭 까지요
신성조
20.05.14 01:56

참고로 저게 왜 동일한 용량에서 적중율이 비슷해야되냐하면.. IF 문제가

4코어당 캐시가 묶여있자나요 AMD가 급격히 게이밍성능이 빠지는게 그 4코어당 묶여있는 캐시끼리 공유를 위해 IF요걸 통과해야되기 때문이라 캐시 공유가 필요없는 형태에서도 높은 적중율을 보여주거나 아님 아예 구조 개선을 통해 대용량캐시 + 8코어 CCX 구조로하던가 양자 택일하면 인텔못지않게 될거거든요