Superuser

Autor Thema: Octane-ESI stirbt...  (Gelesen 3538 mal)

Oliver_sgi

  • Gast
Octane-ESI stirbt...
« am: 29. August 2004, 21:55:30 »
Hallo zusammen,

vielleicht kann mir einer von Euch einen Hinweis geben: Meine Octane mit ESI-Grafik hat seiner einiger Zeit den Hau daß die Grafik "aufgibt". Zuerst wird der ansonsten rote Mauszeiger schwarz und springt wild durch die Gegend bzw. ruckelt, ein paar Momente später geht garnix mehr: Bildschirm ist eingefroren und weder Maus noch Tastatureingaben sind möglich. Übers Netzwerk lässt sich die Maschine auch nicht mehr ansprechen. Ein Reboot hilft nix, die Octane bleibt bei der roten Front-Lampe hängen und am seriellen Terminal meldet sie:

Exception: <vector=Normal>
Status register: 0x34045083<CU1,CU0,FR,CH,IM7,IM5,IPL=???,KX,MODE=KERNEL,EXL,IE>

Cause register: 0xc01c<CE=0,IP8,IP7,EXC=DBE>
Exception PC: 0xffffffff9fc3e2d8, Exception RA: 0x10000000
Data Bus error
HEART ISR :     0x8000000000000000<HEART_EXC>
HEART IMSR:     0x8000000000000000<HEART_EXC>
    Cause: 0x10000<WIDGET_ERR>
       Widget Error type: 0x8<PIO_RD_TIMEOUT>
       PIO rd timeout address: 0xc02c<CPU=0,IO_SPACE=0x0,DIDN=0xc,ADDR=0x2c>
 VID 0's saved user regs in hex (gpda=0xa800000020f254c8):
 arg: 0 195d04040a1c10 1 195c0408000000
      1800000000 195c0400000000 195d0404120c08 0
 tmp: 900000001c030000 0 3 5
 sve: 900000001c020000 900000001c120000 195c0408000000 0
      19120400000000 195d0400000244 195d0400000344 2
 t8 0 t9 195c0418000000 at 195c0400000024
 v0 1 v1 1 k1 ffffffffbad11bad
 gp 0 fp 195c0428000000 sp a800000020ffed70 ra 10000000

PANIC: Unexpected exception

[Press reset or ENTER to restart.]

------------------------------------------------------------------------------------
Es hilft nur, ein paar Stunden abzuwarten und dann neu zu booten. Der Effekt kommt dann allerdings nach ein paar Minuten wieder. Also ein thermisches Problem. Aber an welcher Stelle ????

Bevor ich jetzt anfange, wild in ebay Ersatzteile zu ersteigern, wollte ich mal fragen, ob einer von Euch sowas schon mal erlebt hat oder sonstwie eine Hinweis hat, wie ich dat Maschinchen wieder ans Rennen kriege.

Gruß
Oliver

mood-indigo.org - Das unabhängige Silicon Graphics User Forum

Octane-ESI stirbt...
« am: 29. August 2004, 21:55:30 »

Impact

  • Gast
Re: Octane-ESI stirbt...
« Antwort #1 am: 29. August 2004, 22:08:13 »
Irgendwie sagt mir mein Gefühl, das es die FP (Frontplane) mit dessen XBow ist.
Da du je schon selbst vermutest das es ein Thermisches Problem ist, und bevor du jetzt wie auch schon vorher gesagt anfängst wie wild Teile zu ersteigern, würde ich an deiner Stelle das System Komplett auseinander nehmen, und alles säubern und vor allem entstauben.
Dabei würde ich ein besonderes Augenmerk auf alle "interconnects" und Fans werfen.
Wenn du das aber tust, bitte nicht die XIO Connectors, sowie deren Gegenstück berühren!
Ebenso würde ich auch mal schaun ob noch der FAN auf dem XBow rotiert und nicht die Lufteinlässe von Staub verdichtet sind.
Nicht auszuschliessen ist natürlich auch das Mainboard, RAM, CPU,die ESI an sich, sowie eine PSU die ihre Spannungsspitzen nicht mehr erreicht, und ein vorkorkstes IRIX.
Nuja eine Ferndiagnose ist schwer, aber zumindest hast du jetzt ein paar Anregungen :)
Viele Grüsse,
Markus
;)

Oliver_sgi

  • Gast
Re: Octane-ESI stirbt...
« Antwort #2 am: 30. August 2004, 18:00:46 »
Habe die Maschine vor ca. 10 Monaten erworben und gleich gründlich gesäubert. Staub ist da keiner mehr drin ...
Die Lüfter laufen auch alle, es zieht sozusagen wie Hechtsuppe durchs Gehäuse.
IRIX kanns ja eigentlich auch nicht sein, soweit kommt er ja nach Auftreten des Fehlers und anschließendem Reboot gar nicht mehr.
Der beste Hinweis den ich in der Boot-Fehlermeldung finden kann ist (ich zitiere):

...
Data Bus error
HEART ISR :     0x8000000000000000<HEART_EXC>
HEART IMSR:     0x8000000000000000<HEART_EXC>
   Cause: 0x10000<WIDGET_ERR>
      Widget Error type: 0x8<PIO_RD_TIMEOUT>
      PIO rd timeout address: 0xc02c<CPU=0,IO_SPACE=0x0,DIDN=0xc,ADDR=0x2c>
...

Also ein PIO (Parallel IO ?) Read Timeout am Data Bus. Oder ?
Kann einer damit was anfangen ?
Kann ich nochwas machen, um den Fehler weiter einzugrenzen?
Mir fällt nämlich jetzt nur noch ein, das Maschinchen als defekt zu verticken, da ich irgendwie keine Lust verspüre nach und nach Geld für das vermeintlich richtige Ersatzteil auszugeben.

Nehme noch gerne Hinweise auf!

Gruß
Oliver

Impact

  • Gast
Re: Octane-ESI stirbt...
« Antwort #3 am: 30. August 2004, 18:51:50 »
Im Maintenance Setup des Proms kannst du ein Hardware Test durchführen - den schonmal versucht?

Gerhard.Lenerz

  • Gast
Re: Octane-ESI stirbt...
« Antwort #4 am: 02. September 2004, 15:47:01 »
Hallo,

Zitat
Habe die Maschine vor ca. 10 Monaten erworben und gleich gründlich gesäubert. Staub ist da keiner mehr drin ...


bist Du da sicher? In einer sehr staubigen Umgebung (z.B. Wohnraum mit Teppich(böden)) kann in 10 Monaten eine Menge beisammen kommen. Und durch den extremen Luftzug setzt sich das bei der Octane dann wohl besonders gerne zuerst mal in den kleinen Eckchen ab.

Zitat
Data Bus error
HEART ISR :     0x8000000000000000<HEART_EXC>
HEART IMSR:     0x8000000000000000<HEART_EXC>
  Cause: 0x10000<WIDGET_ERR>
     Widget Error type: 0x8<PIO_RD_TIMEOUT>
     PIO rd timeout address: 0xc02c<CPU=0,IO_SPACE=0x0,DIDN=0xc,ADDR=0x2c>


Kannst Du mal ein hinv -vm posten?


Gerhard

Oliver_sgi

  • Gast
Re: Octane-ESI stirbt...
« Antwort #5 am: 02. September 2004, 19:26:38 »
Hm, werde das alles mal ausprobieren, heute abend habe ich wieder Zeit! Ich muss mich natürlich bei allem beeilen, da ja die mittlere mögliche Betriebszeit auf wenige Minuten zusammengeschrumpft ist.
Bezüglich Staub: Ja, ich bin ziemlich sicher, daß sich da nix wieder abgesetzt hat, da ich die Octane nur selten in Betrieb hatte und ich nach Auftreten des Fehlers natürlich erstmal wieder alles auseinander- und wieder zusammen-gebaut habe.

Gruß
Oliver

Oliver_sgi

  • Gast
Re: Octane-ESI stirbt...
« Antwort #6 am: 03. September 2004, 01:07:23 »
So, heute abend habe ich sie also mal wieder eingeschaltet...
Erstmal duchgebootet bis zum Login von IRIX damit ich hinv -vm posten kann (den Output interessiert zwar nach komplettem Lesen diese Meldung niemand mehr, der an der Problemlösung interessiert ist, aber der Vollständigkeit halber und um ... aber dazu siehe weiter unten):

Location: /hw/node
     PM10225MHZ Board: barcode HRH756     part 030-1272-002 rev  F
Location: /hw/node/xtalk/15
           IP30 Board: barcode GAH014     part 030-0887-005 rev  A
Location: /hw/node/xtalk/15/pci/2
   PWR.SPPLY.S2 Board: barcode AAC7490248 part 060-0038-001 rev  C
            FP1 Board: barcode 65905C     part 030-0891-003 rev  E
Location: /hw/node/xtalk/12
          MOT10 Board: barcode HRH081     part 030-1241-002 rev  G
1 225 MHZ IP30 Processor
Heart ASIC: Revision E
CPU: MIPS R10000 Processor Chip Revision: 3.4
FPU: MIPS R10010 Floating Point Chip Revision: 0.0
Main memory size: 512 Mbytes
Xbow ASIC: Revision 1.3
Instruction cache size: 32 Kbytes
Data cache size: 32 Kbytes
Secondary unified instruction/data cache size: 1 Mbyte
Integral SCSI controller 0: Version QL1040B (rev. 2), single ended
 Disk drive: unit 1 on SCSI controller 0 (unit 1)
 Disk drive: unit 2 on SCSI controller 0 (unit 2)
Integral SCSI controller 1: Version QL1040B (rev. 2), single ended
IOC3 serial port: tty1
IOC3 serial port: tty2
IOC3 parallel port: plp1
Graphics board: ESI
Integral Fast Ethernet: ef0, version 1, pci 2
Iris Audio Processor: version RAD revision 12.0, number 1
 PCI Adapter ID (vendor 4265, device 3) pci slot 2
 PCI Adapter ID (vendor 4215, device 4128) pci slot 0
 PCI Adapter ID (vendor 4215, device 4128) pci slot 1
 PCI Adapter ID (vendor 4265, device 5) pci slot 3

---------------------------------------------------------------------------------

Danach in den PROM-Monitor, um die Diagnose durchzuführen. Er fing auch ganz munter an zu testen aber irgendwann (ich habe zugegebenermasse nicht die ganze Zeit gebannt auf den Monitor gestarrt) war die Front-LED konstant rot und der Monitor minutenlang schwarz. Also: ausschalten.
Hinten die Grafikkarte gezogen, wieder eingeschaltet. Wie zu erwarten nur Leben an der seriellen Schnittstelle, der Boot-PROM erschien, das Diagnose-Programm aufgerufen, und ...

... es lief durch. Aha! Also das Grafik-Board defekt. Oder hat noch jemand eine bessere Idee ?

BTW, hat jemand Interesse am Erwerb meiner Octane ohne funktionierende Grafik ? Die Ausstattung ist ja in aller Ausführlichkeit oben beschrieben :-)


Schöne Grüße
Oliver

Gerhard.Lenerz

  • Gast
Re: Octane-ESI stirbt...
« Antwort #7 am: 03. September 2004, 01:10:14 »
Hmmm... das sieht ja dann doch schon recht eindeutig aus. Meine Überlegung ging noch dahin, ob da vielleicht eines der bekannt schlechteren Mainboards mit Problemen am HEART ASIC drin ist, aber IIRC waren das ältere als die 030-0887-005 Modelle.


Gerhard