안녕하세요.
M4000 PCI슬롯에 Graphic Card를 장착해서 사용하고 있습니다.
정상 운영되던 중 panic messages가 발생 하였습니다.
XSCF> showlogs panic –d 0
panic[cpu5]/thread=3003533e0e0: invalid SFSR Errors(s)
Mar 16 21:25:21 KST 2012
Mar 16 21:25:21 KST 2012 000002a1027ed990 FJSV,SPARC64-VII:opl_cpu_sync_error+410 (60000000, 0, 42808043, 5a004000, 1, 2a1027eda48)
Mar 16 21:25:21 KST 2012 %l0-3: 0000000000000000 0000000000000000 000000000193c000 ffffffff9fffffff
Mar 16 21:25:21 KST 2012 %l4-7: 00000000ec000000 00000000ec000000 0000000000000000 0000000000000000
Mar 16 21:25:21 KST 2012
Mar 16 21:25:47 KST 2012 syncing file systems... 5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 done (not all i/o completed)
Mar 16 21:25:48 KST 2012
ereport.io.fire.pec.ldn ena=695cf73303c07c01 detector=[ version=0 scheme="dev"
Mar 16 21:25:48 KST 2012
device-path="/pci@2,600000" ] primary=1 tlu-oeele=fff7ff tlu-oeie=
Mar 16 21:25:48 KST 2012
fff7ff00fff7ff tlu-oeis=200 tlu-oeess=200
Mar 16 21:25:48 KST 2012
Mar 16 21:25:48 KST 2012
ereport.io.fire.pec.lup ena=695cf75ccfc07c01 detector=[ version=0 scheme="dev"
Mar 16 21:25:48 KST 2012
device-path="/pci@2,600000" ] primary=1 tlu-oeele=fff7ff tlu-oeie=
Mar 16 21:25:48 KST 2012
fff7ff00fff7ff tlu-oeis=100 tlu-oeess=100
Mar 16 21:25:48 KST 2012
prtdiag로 확인 결과 Graphic Card 불량임을 확인 하였습니다.
# prtdiag -v
•
========================= IO Devices =========================
•
IO Lane/Frq
LSB Type LPID RvID,DvID,VnID BDF State Act, Max Name Model Logical Path
--- ----- ---- ------------------ --------- ----- ----------- ------------------------------ --------------------- -----------
00 PCIe 2 80, 5b64, 1002 2, 0, 0 okay 8, 16 SUNW,XVR-300 SUNW,375-3458
/pci@2,600000/SUNW,XVR-300@0
해당 그래픽 카드 (375-3458)은 M4000에 호환이 안되는 제품이라는 것 을 알게되었고, M4000에 호환이 되는 Graphic Card는 375-3545라는 것 확인 후 교체작업을 실시하였습니다.
문제는 지금부터였는데... 교체를 하고 장착되어있는 파트를 확인했더니 375-3545였습니다.
prtdiag 상에는 분명 375-3458로 표기하고 있는데 말이죠.....
그래서 375-3458 파트의 확인하였더니 그 파트는 M4000 PCI 케이스에 장착조차 안되는 파트였다는 것을 알게되었습니다.
375-3545, 375-3458 이 완전히 다른 두파트가... 375-3545파트가 어째서 375-3458로 OS상에 표기되는건지...
Graphic Card 혹은 OS firmware 아니면 XCP version에 이상이 있을까요?
버전이 낮다고 하여도 다른 파트번호가 보일 수 있을까요?
어째서 panic이 발생하였을지....
혹시 이 예매한 상황을 해결하실 수 있는 방법을 아시는 분 답변 부탁드립니다.
감사합니다.
첫댓글 fmdump 확인해보시는게 어떠실런지요~ xscf에서든 os에서든~
파트넘버가 다르게 나오는 이유는 정확히는 모르겠지만.. 같은 XVR-300 모델이니 그다지 크게 상관은 없을듯합니다.