Autor Thema: Onyx2 bootet nicht...  (Gelesen 10077 mal)

ulrik_sgi

  • Gast
Onyx2 bootet nicht...
« am: 29. November 2002, 15:45:10 »
So, heute ist das Baby endlich gekommen :)

Optisch sieht sie ja einwandfrei aus, nur gibts da ein Problem: die Kiste bootet ums verrecken net!

Wenn ich Sie einschalte, bekomme ich vom system panel auch ein "system ok", dann wird der Monitor erkannt, darauf steht

"Reality Graphics
Prom Revision 115
2 Ges, 1 RMs
Video Channel 0 source at (0,0) size 1280x1024, format size 1280x1024"

also scheint auch die graphic pipe zu laufen...nur...weiter tut sich nix. Habs mehrmals probiert und auch immer weit über 20 Minuten gewartet (ich weiß, das die Onyx2 lange braucht...meine OnyxRE2 braucht ja schon fast ne viertel Stunde, bis alles läuft).

Auf dem SystemPanel steht dann "mod 1 c", und hinten siehts folgendermaßen aus:

Die linke CPU LED leiste des Node boards ist (von oben nach unten):
an - aus - an - aus - an - aus - an - aus
konstant, also immer abwechseln ein Licht an und aus, die rechte jedoch:
an - blinkt - an - an - an - blinkt - an - blinkt
und das wie gesagt ewig.

Ich hab auch schon versucht, die Origin Vault vom SCSI Bus zu nehmen, ohne Erfolg.

Die Systemplatte ist in der Onyx2 selbst.

Hat jemand zufällig das Owner's Guide der Onyx2 zu Hand und kann dieses Fehlerbild interpretieren???

danke für die Hilfe!

ulrik

mood-indigo.org - Das unabhängige Silicon Graphics User Forum

Onyx2 bootet nicht...
« am: 29. November 2002, 15:45:10 »

msunix

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #1 am: 29. November 2002, 15:52:56 »
Hi Ulrik!

Hänge mal ein Terminal (9600,8,n,1) an die erste serielle Schnittstelle, da sollten dann die Bootmeldungen kommen.

Vermutlich ist nur das NVRAM zurückgesetzt worden, dann steht die Variable 'console' nämlich auf 'd', d.h. die Systemkonsole ist am seriellen Terminal. Dann kannst Du die Variable auf 'console=g' stellen und das Ding bootet über die Grafikpipe.

NB: Es ist immer empfehlenswert, an dem Ding eine serielle Konsole greifbar zu haben.

NB2: Owner's Guide gibt's auf Techpubs:
http://techpubs.sgi.com/library/tpl/cgi-bin/getdoc.cgi?coll=hdwr&db=bks&fname=/SGI_Admin/Onyx2_Desk_OG&srch=onyx2%20owners%20guide

Allerdings steht da nicht viel drin.
Viel interessanter wären 'Installation Guide' und 'Maintenance Guide' allerdings kommt man an die nicht ran! :( Sind von SGI als geheim eingestuft und dürfen nicht rausgegeben werden. Über die viel neueren Onyx/Origin 300/3000 sind diese Informationen auf Techpubs frei verfügbar! <grrr>

msunix

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #2 am: 29. November 2002, 15:56:46 »
Ergänzung:

Die Meldung 'mod 1c' am MSC ist normal, das zeigt, welches Nodebaord den MSC bedient. (NB, rein interessehalber: Welche Firmware-Rev. hat bei Dir der MSC?)

Das Blinken der LED's am Nodeboard ist auch normal. Erst wenn IRIX läuft sollten die unteren beiden LED's imemr blinken (Heartbeat), die restlichen zeigen die Auslastung der beiden CPU's an.

Ich hab hier - für viel Geld - kürzlich ein internes Schulungs-Manual für die Onyx2 "organisiert", leider stehen kaum interessante Details drin, dafür wird immer auf die beiden o.g. Manuals verwiesen, die ich natürlich nicht habe >:( , aber zumindest die Funktion der Nodeboard-LED's und einiger PROM-Besonderheiten wird gut erklärt. Ich werde die interessanten Seiten bei Gelegenheit mal einscannen und als .pdf auf meine Website stellen.

Servus,
  Michael
« Letzte Änderung: 29. November 2002, 16:02:31 von msunix »

ulrik_sgi

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #3 am: 29. November 2002, 15:59:33 »
Danke für die prompte Hilfe, das is ja besser als beim offiziellen Telefonsupport hier :)

OK, ich werde mal ein serielles Terminal ausgraben bzw. mal meine VW 540 dranhängen...ich gebe Statusmeldung ;)

ulrik_sgi

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #4 am: 02. Dezember 2002, 19:05:08 »
so macht das alles keinen spaß!!!

Nach mehrstündiger fehlersuche, warum ich kein Bild bekomme, hab ich jetzt den Fehler gefunden: das eeprom vom Reality board ist entweder fehlerhaft oder schlicht und einfach leer!!!

ireeprom -v -p 0 zeigt "mapall: unknown error"

ireeprom -i -p 0 zeigt "mapall: unknown error"

Genau genommen bringen alle ireeprom options diesen fehler (außer das "forcibly reset to older revision", daran hab ich mich noch net gewagt)

Also sehe ich zwei Möglichkeiten:

1) Irgendwie das eeprom auf "Werkeinstellungen" zurücksetzen, aber wie? Macht "postmortem" das? An das tool hab ich mich nicht gewagt, da ich keine man-seiten dafür finde. Was genau macht postmortem?
(klingt böse)

2) Ein neues eeprom file reinladen, was mich zu den Problem
a) woher bekommen? (Michael? Könntest du evtl. dein eeprom auslesen und mir schicken??? *ganzliebguck)
b) wie bekomme ichs auf die Kiste drauf? Rlogin geht, aber wie kann ich da dateien rüberbringen?


Ich bin wirklich verzweifelt...

jede hilfe ist willkommen!!!

gruß

uli

Malakim

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #5 am: 02. Dezember 2002, 19:10:15 »
Also die Dateien kannst Du wohl mit ftp rüber schaufeln oder nicht ?

- Elmar

msunix

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #6 am: 02. Dezember 2002, 21:37:00 »
Hallo Uli,

Hm, das hört sich irgendwie nicht soo gut an. :(
Aber Du solltest mit 'ircombine' eigentlich einfach eine der Standard-Konfigurationen flaschen können. ircombine musst Du ohne X natürlich remote bedienen.

NB: Was sagt denn eigentlich 'gfxinfo -v'?
Werden alle KONA-Karten richtig erkannt?
Könnte evtl. sein, dass es durch den Transport ein Kontaktproblem, o.Ä. gibt.

Sorry, ich kann Dir im Moment nicht weiter helfen, da ich grad keine Onyx in der Nähe habe und wohl auch in den nächsten Tagen keine erreichen kann. Bin z.Zt. im tiefsten Ösiland, genauer gesagt in Steyr, und werde da wohl auch noch bis mind. Mittwoch bleiben. Leider, denn ich bin nicht wegen der schönen Landschaft hier...

Servus,
  Michael

ulrik_sgi

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #7 am: 02. Dezember 2002, 22:16:09 »
Sowohl hinv als auch gfxinfo erkennen das Realityboard und den zugehörigen Rastermanager.

Auf einem englischen Board hab ich von  einem ähnlichen Problem gelesen, eine komplett "miskonfigurierte" Onyx2 IR (ok, meine is Reality, is ja egal), und da stand, daß genau dafür "postmortem" da ist, so eine Art "wenn nix mehr geht".

Also hab ich Postmortem ausgeführt.

Danach bekomme ich jetzt wenigstens folgendes von ireeprom:

"graphics not responding...trying again
graphics not responding...trying again
graphics not responding...trying again
umode loaded
unable to connect to graphic pipe 0"

Klingt net so wirklich fein.

Dazu kommt (ich halts bald nicht mehr aus), daß mir jetzt schon dreimal die Maschine eingefroren ist! Rlogin Verbindung steht auf einmal, heartbeat der CPUs ist aus, eine der CPUs laut LEDs auf Anschlag.

Bekomme aber vorne keine Temperatorfehlermeldung.

So, jetzt fährt sie gerade nochmal hoch (nachdem postmortem), vielleicht kann ich ja jetzt noch ein paar sachen ausprobieren.

"Flashen" mit ircombine war meine erste Idee, aber ircombine kann anscheinend nur die video combination im eeprom flashen. Es bemängtelt, das das eeprom leer ist.

Also genau genommen hab ich momentan ne lila Origin ;)


Ich probier mal weiter, ich weigere mich zu glauben, daß das Realityboard tot ist. Von mir aus alles andere, alles andere ist noch halbswegs preisgünstig zu ersetzen, aber BITTE nicht das KONAL-board...

ich probier mal weiter *verzweifel

ulrik_sgi

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #8 am: 02. Dezember 2002, 22:18:08 »
während ich das geschrieben habe ist wieder der CPU heartbeat verstummt..diesmal ohne Last auf den CPUs (einfach booten...warten...stirbt)


ulrik_sgi

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #9 am: 02. Dezember 2002, 22:23:53 »
ireeprom -i -p 0 gibt endlich was von sich

Ob's mir gefällt?

====== Pipe 0 ======
Killed


Yipie.

Ich tanze tango...

Was ist bei SGI die Definition von "killed"? Fubar?

msunix

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #10 am: 02. Dezember 2002, 22:39:04 »
Hi Uli!

Das kommt mir alles irgendwie merkwürdig vor. :/
Also das mit dem 'Pipe 0 Killed' dürfte AFAIK bedeuten, dass das Board nicht antwortet.

Das mit dem Einfrieren macht mir aber fast noch mehr Sorgen. Hast Du schon mal nachgeschaut, ob dabei was im Syslog vermerkt wird?

Schon mal geschaut, ob alles fest sitzt, alle Kontake, etc?
Bei meiner Onyx2 war nach dem Transport von München zu mir in einem Kleinbus einer der vielen kleinen Kühlkörper auf dem RM8-Board locker, ich hab's zum Glück bemerkt bevor er ganz runtergefallen ist und womöglich einen Kurzschluss gebaut hätte...

Servus,
  Michael

Ergänzung: Ich versuche mal etwas mehr über Dein Problem in Erfahrung zu bringen. Könntest Du mal einen Output von gfxinfo -v schicken?
Noch eine Ergänzung, dürfte euch aber weit weniger freuen als mich: Meine Frau hat grad angerufen - die Telegeh will mir endlich DSL legen!!! :D :D :D

Servus,
  Michael
« Letzte Änderung: 02. Dezember 2002, 22:48:35 von msunix »

ulrik_sgi

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #11 am: 02. Dezember 2002, 22:48:28 »
während ich eben per rlogin drauf war, ist sie mir wieder eingefroren, ich hab sie parallel dazu angepingt (bis sie starb und der ping ebenfalls keine antwort mehr bekam).

64 bytes from 192.168.123.201: icmp_seq=29 ttl=255 time=1.021 ms
64 bytes from 192.168.123.201: icmp_seq=31 ttl=255 time=1.555 ms
64 bytes from 192.168.123.201: icmp_seq=33 ttl=255 time=1.502 ms
64 bytes from 192.168.123.201: icmp_seq=53 ttl=255 time=273.37 ms
64 bytes from 192.168.123.201: icmp_seq=58 ttl=255 time=1.515 ms
64 bytes from 192.168.123.201: icmp_seq=75 ttl=255 time=372.884 ms
64 bytes from 192.168.123.201: icmp_seq=79 ttl=255 time=158.093 ms
64 bytes from 192.168.123.201: icmp_seq=80 ttl=255 time=1.51 ms
64 bytes from 192.168.123.201: icmp_seq=94 ttl=255 time=417.882 ms
64 bytes from 192.168.123.201: icmp_seq=104 ttl=255 time=305.774 ms
64 bytes from 192.168.123.201: icmp_seq=107 ttl=255 time=347.485 ms
64 bytes from 192.168.123.201: icmp_seq=109 ttl=255 time=623.094 ms
64 bytes from 192.168.123.201: icmp_seq=118 ttl=255 time=20.642 ms
64 bytes from 192.168.123.201: icmp_seq=153 ttl=255 time=1.7 ms
64 bytes from 192.168.123.201: icmp_seq=156 ttl=255 time=1.36 ms
64 bytes from 192.168.123.201: icmp_seq=159 ttl=255 time=1.532 ms
64 bytes from 192.168.123.201: icmp_seq=163 ttl=255 time=535.487 ms
64 bytes from 192.168.123.201: icmp_seq=169 ttl=255 time=597.877 ms
64 bytes from 192.168.123.201: icmp_seq=189 ttl=255 time=219.979 ms
64 bytes from 192.168.123.201: icmp_seq=199 ttl=255 time=83.893 ms
64 bytes from 192.168.123.201: icmp_seq=210 ttl=255 time=238.289 ms
64 bytes from 192.168.123.201: icmp_seq=219 ttl=255 time=1.454 ms
64 bytes from 192.168.123.201: icmp_seq=237 ttl=255 time=147.362 ms
64 bytes from 192.168.123.201: icmp_seq=252 ttl=255 time=309.569 ms
64 bytes from 192.168.123.201: icmp_seq=273 ttl=255 time=583.536 ms
64 bytes from 192.168.123.201: icmp_seq=282 ttl=255 time=659.529 ms
64 bytes from 192.168.123.201: icmp_seq=284 ttl=255 time=218.435 ms
64 bytes from 192.168.123.201: icmp_seq=285 ttl=255 time=0.514 ms
64 bytes from 192.168.123.201: icmp_seq=291 ttl=255 time=21.337 ms
64 bytes from 192.168.123.201: icmp_seq=295 ttl=255 time=207.185 ms

Was geht da ab? DIe Antwortzeiten verrieren so extrem.

Eine ganz blöde Frage: kann es am Stromnetz liegen? Meine USV hat heute abend zweimal über einen sehr kurzen Spannungsabfall im Netz geklagt, die Onyx2 hängt jedoch momentan - da meine USV nur 1500 Watt bringt - noch direkt am Stromnetz...könnten Stromschwankungen das Nodeboard zu einfrieren bringen?

Wenn ich ne Temperaturfehlermeldung bekomme würde, könnte ichs ja irgendwo verstehen...

Ich fahr sie jetzt nochmal hoch und such das syslog.

PS: glückwunsch zum TDSL :)
« Letzte Änderung: 02. Dezember 2002, 22:51:34 von ulrik_sgi »

ulrik_sgi

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #12 am: 02. Dezember 2002, 23:04:18 »
So, hab die Schnauze voll für heute, jetzt hauts mir hier jedesmal die Sicherung raus, wenn ich das Netzteil der Onyx2 anschalte...

Ich muß jetzt erstmal was anderes machen, sonst fliegt gleich ne 200 Kilo Deskside aus dem Fenster... >:( >:( >:( >:(

msunix

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #13 am: 02. Dezember 2002, 23:21:07 »
Hallo Uli!

Ob's am Strom liegt lässt sich einfach feststellen:
Wenn Du die Frontblende abschraubst (Kreuzschraube in der Mitte des unteren Kühlgitters an der Frontblende) hast Du das Netzteil vor Dir. Da sollte eine gelbe LED und eine rote sein. Wenn die rote leuchtet oder flackert ist das eher schlecht.
Ebenso hast Du an den Nodebaords ganz oben zwei kleine rote LED's, die rot leuchten, wenn die Spannungsversorgung Ärger macht. Kann auch gut sein, dass das Netzteil einen Hau abbekommen hat, oder auch Spannungsschwankungen, oder ein Kontaktproblem irgendwo in der Maschine durch den Transport. Wie gesagt kann ich da nur auseinandernehmen und alles kontrollieren empfehlen!

Wie is der Stromkreis abgesichert, an den die Onyx hängt? Dass das Netzteil einen hohen Einschaltstrom zieht ist normal, bei mir meckert auch immer die USV und es flackert sogar leicht das Licht, wenn ich das Netzteil meiner Maschine einschalte. Aber das ist wohl durch die dicken Elkos im Schaltnetzteil bedingt, es kann aber sein, dass eine flinke oder zu schwache Sicherung auslöst. Als Vorsicherung würde ich nichts kleineres als 16A nehmen, das geht bei mir wohl so gerade noch.

Interessant wäre auch ob/was im Syslog steht.

Die z.T. enorm langsamen Ping-Zeiten irritieren mich auch ein wenig. Was hast Du für ein Netz? 10 oder 100MBit?
Hast Du schon mal geschaut, was auf der Maschine alles so an Prozessen läuft? Ach ja, und was für eine IRIX-Version ist da drauf?

Servus,
  Michael

ulrik_sgi

  • Gast
Re: Onyx2 bootet nicht...
« Antwort #14 am: 03. Dezember 2002, 00:17:52 »
Dann setz ich mich halt doch nochmal an die Höllenmaschine ;)

Ich hab sie jetzt an die USV gehängt, oh die hat aber ganz böse gemeckert, als ich das Netzteil angefahren habe :)

Wenn blinken töten könnte, dann hätte die USV mich grad gekillt.

Also, frontblende abgenommen, keine Probleme am Netzteil, die beiden Warn-LEDs hinten am Nodeboard schweigen auch still.

Ich hab jetzt die Maschine mal rumgedreht und lasse, sobald ich per rlogin drauf komm, einfach mal ein top laufen, um zu sehen, was abgeht, bevor die Maschine einfriert.

Wo finde ich bei IRIX denn genau das syslog? /var/syslog oder /var/log/syslog oder an einem eher untypischen Ort?

Installiert ist momentan IRIX 6.4.

Auf ein neues...