Superuser

Autor Thema: fehler beim hardware test ?  (Gelesen 4242 mal)

gemm

  • Gast
fehler beim hardware test ?
« am: 17. Februar 2004, 21:05:12 »
habe hier ein 300mhz rm7000 modul fuer die o2; gleiches modell, wie die letzten ebay-auktionen; mit 256kb on-die level2 cache aber ohne level3 cache. es treten im hardware test (maintenance menu) fehler auf:

ICache 2 test
Hardware failure detected in instruction cache misc test

SCache 4 test
Error code = IP32.08.03.04.06, w1 = 8140xxxx, w2 = 000000aa

die xxxx zaehlen hoch, die fehlermeldungen laufen ca. 10 minuten ueber den bildschirm, dann geht der hardware test mit den grafiktests weiter und laeuft bis zum ende durch.

getestet wurde mit irix 6.5.20 und 6.5.22 in mehreren maschinen. das os laeuft aber einwandfrei und bisher konnte ich auch noch keine programmfehler oder unmotivierte abstuerze gegenueber dem alten r10k moduls entdecken.

ich hatte irgendwelche infos im kopf, nach denen die ersten rm7000a chips fehler im chipdesign hatten (welhalb sgi seinerzeit auch eine umtausch-aktion durchfuehrte); bin mir aber nicht mehr sicher, ob das den cache betraf. demzufolge sollten diese fehlermeldungen durch einen tausch der cpu (z.b. im zuge eines 600mhz-umbaus) wegfallen.
dem ist leider nicht so, das 600mhz modul laeuft seit einigen tagen in meiner maschine und es treten die gleichen fehler waehrend des tests auf. auch hier laeuft das os aber einwandfrei.

der hinv erkennt die 300mhz version als qed rm7000(a?) chip revision 2.1. der 600mhz chip ist ein pmc rm7000c und wird vom hinv als qed rm7000 chip revision 5.1 erkannt

kann das einer der kaeufer der ebay-module bestaetigen ?
« Letzte Änderung: 17. Februar 2004, 21:28:28 von gemm »

mood-indigo.org - Das unabhängige Silicon Graphics User Forum

fehler beim hardware test ?
« am: 17. Februar 2004, 21:05:12 »

andreas@rootprompt

  • Gast
Re: fehler beim hardware test ?
« Antwort #1 am: 17. Februar 2004, 21:30:54 »
hab zwar keins von den eBay-Modulen, aber trotzdem so ein Teil.

Es waren nicht nur die ersten RM7000 die einen Fehler im Chip-Design hatten, sondern alle von SGI verkauften (wie das mit den PMC-Teilen ist, weiß ich nicht).

Die Cache-Fehler könnten damit zusammenhängen, dass auf diesen 300 Mhz Prototypboards der L3 abgeschaltet ist, bzw. fehlt.

Bisher hab ich jedenfalls keine Probleme mit dem Teil gehabt, und die O2 ist gerade in den letzten Monaten reichlich und hart belastet worden.

gemm

  • Gast
Re: fehler beim hardware test ?
« Antwort #2 am: 17. Februar 2004, 21:36:20 »
hm, das kingt plausibel.
andererseits - woher "weiss" die maschine vom fehlenden level3 cache ? bei der initialisierung der cpu durch das eprom wird der cache ja nicht aktiviert - sei er nun vorhanden oder nicht.

treten bei deiner cpu auch diese fehler auf ?
« Letzte Änderung: 17. Februar 2004, 21:36:46 von gemm »

andreas@rootprompt

  • Gast
Re: fehler beim hardware test ?
« Antwort #3 am: 17. Februar 2004, 21:39:31 »
keine Ahnung, woher die CPU das weiß ;)
Ich habe da halt einfach im Hinterkopf, dass es ein Prototyp ist...

Ich kann Dir gar nicht sagen, ob bei meiner Maschine das auch auftritt, weil der Monitor da dran keine 60 Hz macht, aber ich vermute es mal stark.

tg_it

  • Gast
Re: fehler beim hardware test ?
« Antwort #4 am: 17. Februar 2004, 21:46:10 »
ich habe auch eins von dem rm7000 300 modulen. ich bin auch der meinung das es am fehlenden l3 cache liegt. der test sagt dies und meldet später diverse errorcodes genau wie bei dir.


andreas@rootprompt

  • Gast
Re: fehler beim hardware test ?
« Antwort #5 am: 17. Februar 2004, 23:48:43 »
ansonsten, wenn's Dich zu sehr stört, kannst Du ja zu einem der R5k@250 Modulen greifen, die jetzt auch auf eBay auftauchen. Aus dem selben Container gefischt, auch schön flott und ganz ohne Fehler in den Diagnostiscs ;)

gemm

  • Gast
Re: fehler beim hardware test ?
« Antwort #6 am: 18. Februar 2004, 18:32:58 »
na, bei denen ist nicht klar, ob der cpu-austausch zum 600mhz modell klappt. bei meinem hat es funktioniert ;)

DSS

  • Gast
Re: fehler beim hardware test ?
« Antwort #7 am: 19. Februar 2004, 17:52:01 »

Zitat

keine Ahnung, woher die CPU das weiß ;)
Ich habe da halt einfach im Hinterkopf, dass es ein Prototyp ist...


Da gibt es so´nen klitze kleinen Baustein (EEPROM) auf dem CPU-Modul. Der stellt die CPU ein.

andreas@rootprompt

  • Gast
Re: fehler beim hardware test ?
« Antwort #8 am: 19. Februar 2004, 20:24:17 »

Zitat

na, bei denen ist nicht klar, ob der cpu-austausch zum 600mhz modell klappt. bei meinem hat es funktioniert ;)


bei Deinem R5k@250?  Oder hab ich das was falsch verstand? ;)

gemm

  • Gast
Re: fehler beim hardware test ?
« Antwort #9 am: 22. Februar 2004, 18:22:56 »
das waere eigentlich einen gedanken wert. sind die r5000@250mhz pinkompatibel zu den rm7000 ? soweit ich mich an die bilder der prototypen-module erinnere haben die cpus zumindest das bga gehaeuse (so wie die originalen r5000@200mhz auch).
andere versorgungsspannungen werden sicher benoetigt, das ist klar; und das eprom fuer die diversen einstellungen muss auch getauscht werden - aber die cpu selbst ?

p.s. nein ich habe ein rm7k@300mhz fuer den umbau "geopfert"