Hardware > Hardware Probleme
Octane Aufrüstungsproblem
seeker:
Hallo,
habe hier ein seltsames Problem bei der Aufrüstung einer Octane eines Bekannten.
Ausgehend von einer Octene single 175MHz/SE wollte ich ein dual 195MHz Modul einbauen.
Erstmal lief alles 3 Tage wunderbar. Dann Fehler:
PANIC: CPU1: TLBMISS: KERNEL FAULT
...
...
EXEC code:8 ´READ TLB miss`
...
System ist dann hängengeblieben und bootete nicht mehr.
Diagnostic im Maintenance Mode lief aber noch durch und meldete keine Fehler !
Neue Platte und neu installiertes IRIX 6.5.16 bringt keine Änderung.
Mit single 175MHz CPU läuft das System wunderbar.
Das Board ist das neue (030-0887-05) aus der Octane2, 512MB RAM (alle Slots belegt). Netzteil eines der alten (mit schwarzem Griff). Grafik SE.
Was könnte das bedeuten ?
Danke.
msunix:
Hmmm... wenn das Ding drei Tage gelaufen ist dann sollte es kein grundsätzlicher Fehler sein.
Schau mal, ob das Modul richtig eingesetzt ist, keine Kontakte verkantet, alle Schrauben fest, etc.
Wenn das alles passt ist es IMO am wahrscheinlichsten, dass das CPU-Modul einen Hau hat. Möglicherweise einen wärmeabhängigen Fehler, der erst nach längerer Betriebszeit auftritt.
Dass 'ide -fe' nicht unbedingt jeden Fehler findet ist bekannt.
Hast Du eine Möglichkeit, die CPU mal in einer anderen Maschine zu testen? Idealerweise mehrere Stunden unter hoher Last.
Servus,
Michael
seeker:
Die CPU kommt aus einer Maschine, die in den letzten 3 Jahren im Dauerbetrieb und teils unter voller Last gearbeitet hat. Nicht ein einziger Fehler in dieser Zeit. Das Modul ist also in Ordnung.
Verkantet ist auch unwahrscheinlich, da es mehrmals ein und ausgebaut wurde (um die Maschine mit dem single 175er Modul nochmal zu testen).
Gibt es irgendwelche grundsätzlichen Hardware-Unverträglichkeiten mit dual 195er Modulen in bestimmten Boards ? Von R12000 Modulen habe ich gehört, dass manche nicht in bestimmten Platinen laufen - aber 195er R10000 ?
Merkwürdig; jemand noch weitere Ideen ?
Holger251:
Mhhh...google-archives geben dazu nicht viel her. TLB MISS könnte so ziemlich jede Ursache haben.
Hast Du mal in /var/adm/crash geschaut ?
Holger
Christoph:
Da muss man gar nicht weit blicken.
Wenn man hier im Forum nach dem Begriff "TLB" sucht, erhält man den Fehler mehrmals und bei den betroffenen Maschinen war es nur ein sporadisches Verhalten und kein Defekt.
Ein TLBMISS ist in erster Linie nichts Ungewöhnliches.
Es ist eine Fehlermeldung des Kernels, die im Zusammenhang mit der Verwaltung des virtuellen Speicherbereichs des Prozessors zusammen hängt.
http://mood-indigo.org/cgi-bin/YaBB/YaBB.cgi?board=hwprobs&action=display&num=1024053230&start=7
Normalerweise ist die Neuinstallation einer höheren Irix-Version der beste Weg, diesen Fehler auszubügeln.
Die Version 6.5.16 ist aber diesbezüglich weit gereift und bekannte Fehler zum TLB nicht vorhanden.
Eine Neuinstallation hast Du ja bereits getestet.
Die Chancen stehen daher gut (und für Dich schlecht), das die zweite CPU auf dem Modul defekt sein könnte.
Zur Lösung bieten sich nun drei Wege an:
- das Dual-Modul in einer anderen Octane testen (Mainboard)
- das Dual-Modul bei Ebay verkaufen (ohne Garantie)
- eine einzelne R10k195-CPU auftreiben und das Dual-Modul reparieren.
Letzteres funktioniert nur, wenn tatsächlich die CPU und nicht ein Bauteil des Moduls beschädigt ist.
Ich gebe Dir dafür 65% Chance. :)
Navigation
[0] Themen-Index
[#] Nächste Seite
Zur normalen Ansicht wechseln