Probleme mit Solaris Installation auf SunFire V120

  • Ich habe mir hier vor kurzem eine SunRay2 gekauft und wollte diese mit der Sunray Server Software auf einer Solaris Box testen. Also habe ich mir kurzerhand zwei SunFire V120 organisiert. Eine etwas teurer aber mit SCSI-HDs und DVD Drive ausgestattet funktionsfähig, die andere als potentielles Ersatzteillager. Leider traten bei der Solaris Installation unerwartete Probleme auf.


    Vorab beide V120s haben die üblichen Basistests via OBP bestanden. Eine Installation mit einer Debian 12 sparc64 Install-CD war ohne Probleme möglich! Leider schlagen alle Versuche, Solaris 9 oder 10 via Install DVD zu installieren, fehl. Und das mit skurrilen (nicht sonderlich hilfreichen) Fehlermeldungen.


    Solaris 10

    Code
    ok boot cdrom - install
    Boot device: /pci@1f,0/pci@1,1/ide@d/cdrom@0,0:f File and args:
    /platform/sun4u/kernel/sparcv9/genunix bad shndx in symbol 7262
    genunix error reading symbols
    Fast Data Access MMU Miss


    Solaris 9

    Was könnte hier das Problem sein?

    Unter Debian 12 kann ich gut mit der V120 arbeiten. Aber dafür brauche ich keine Sunbox.

    Natürlich habe ich auch das Thema Jumpstart Server versucht. Da gibt es leider bekannte Probleme und ohne Solaris kann ich die OBP patches nicht einspielen.

    https://forum.vcfed.org/index.…ply.1247213/#post-1397711

    Edited once, last by frank128 ().

  • Von der Fehlermeldung her sieht es so aus als ob er die Architektur nicht erkennt und den falschen Kernel booten möchte (sun4u/sparcv9 sieht nicht falsch aus, könnte aber auch eine andere sein). Ich kenne die Sun V120 nicht, habe auch keine Manuals zu dem System. Am besten bei Oracle ein Account anlegen und die Manuals zu dem System herunter laden. Sind die DVDs / CDs original oder als ISO herunter geladen? OpenBoot komplett zurück setzen, alle Einstellungen mal resetten? Wenn Linux bootet, mal einen RAM Test ausfüren? Wie sehen die NVRAM Daten aus? Stehen da sinnvolle Daten drinnen, merkt sich das System Änderungen wenn das System komplett vom Strom getrennt wurde oder muss das NVRAM ersetzt werden. Evl. mal eine der letzten OpenSolaris Live CDs versuchen, evl. sind die Fehlermeldungen klarer. Würde primär auf NVRAM Probleme tippen.....

  • Ich würde das eher so lesen:


    Der bootet schon das richtige File von CD, übergibt dann aber mit "- install" zwei Parameter, die nicht erkannt werden, weil nicht definiert.


    Daß das /sparcv9/unix gebootet wird, spricht eigentlich dafür, daß das NVRAM OK ist, weil da das Startfile drinsteht.

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • Von der Fehlermeldung her sieht es so aus als ob er die Architektur nicht erkennt und den falschen Kernel booten möchte (sun4u/sparcv9 sieht nicht falsch aus, könnte aber auch eine andere sein). Ich kenne die Sun V120 nicht, habe auch keine Manuals zu dem System.

    https://docs.oracle.com/cd/E19102-01/n120.srvr/816-2090-10/816-2090-10.pdf


    sun4u/sparcv9 sollte passen.


    Sind die DVDs / CDs original oder als ISO herunter geladen? OpenBoot komplett zurück setzen, alle Einstellungen mal resetten?

    Als ISO heruntergeladen. OBP hatte ich wegen der Hardware zurückgesetzt. Das Thema NVRAM habe ich noch nicht genauer bearbeitet. Das mit der OpenSolaris Live CD ist eine gute Idee.

  • Stimmt, da shehen ja noch Parameter,bitte versuch mal nur "boot cdrom",

    Solaris 10

    Code
    ok boot cdrom
    Boot device: /pci@1f,0/pci@1,1/ide@d/cdrom@0,0:f  File and args: 
    /platform/sun4u/kernel/sparcv9/genunix bad shndx in symbol 7262
    genunix error reading symbols
    Fast Data Access MMU Miss

    Solaris 9


    Im Grunde der gleiche output



    Ob zwischen "-" und den Optionen wie "install", "nowin" oder "text" ein Leerzeichen stehen muss, ist im Internet nicht immer klar. Unter Linux sollten bei command-line Optionen keine Leerzeichen stehen, mit einer Ausnahme. Aber das hier ist OBP und Forth ...


  • egal welche Variante - immer das gleiche


    Code
    Executing last command: boot cdrom -nowin
    Boot device: /pci@1f,0/pci@1,1/ide@d/cdrom@0,0:f  File and args: -nowin
    Warning: boot will not enable cache
    relocation error: 7: file /platform/sun4u/kernel/sparcv9/unix:  symbol strcpy:
    value 0x2c5a9f37 does not fit
    relocation error: 7: file /platform/sun4u/kernel/sparcv9/unix:  symbol strcpy:
    value 0x303ca2c7 does not fit
    relocation error: 7: file /platform/sun4u/kernel/sparcv9/unix:  symbol highbit:
    value 0x26a9c030 does not fit
    ...
    Code
    Executing last command: boot cdrom - text
    Boot device: /pci@1f,0/pci@1,1/ide@d/cdrom@0,0:f  File and args: - text
    relocation error: 7: file /platform/sun4u/kernel/sparcv9/unix:  symbol strcpy:
    value 0x34223793 does not fit
    relocation error: 7: file /platform/sun4u/kernel/sparcv9/unix:  symbol strcpy:
    value 0x3bf087e4 does not fit
    relocation error: 7: file /platform/sun4u/kernel/sparcv9/unix:  symbol highbit:
    value 0x36301167 does not fit
    relocation error: 7: file /platform/sun4u/kernel/sparcv9/unix:  symbol vmem_xall
    oc:  value 0x25531824 does not fit
  • Code
    ok .version
    Firmware CORE Release 1.0.12 created 2002/1/8 13:0
    Release 4.0 Version 12 created 2002/01/08 13:01
    cPOST version 1.0.12 created 2002/1/8
    CORE 1.0.12 2002/01/08 13:00


    Da fehlt ein wichtiger OBP patch (111991).

  • Hmmm, hmmm, hmmm. Ok, Sun Fire mit (A)LOM / Systemconsole. Kann mir nur noch vorstellen das das (A)LOM merkwürdige boot parameter setzt (unwahrscheinlich, würde man sehen...). Dafür müsste man den gesamten Output vom einschalten des Systems sich ansehen oder in (A)LOM wechseln ( "#.", hash punkt war das glaube ich ...) und da mal schauen. Das (A)LOM kann auch wieder komplett downgegraded werden. Dafür gibt/gab es spezielle CD/DVD die bei den Fire Systemen neben dem OS DVDs dabei waren. Evl. andere Sun Fire Besitzer fragen, online schauen. Habe aber das Gefühl das ich hier viel zu kompliziert denke und das Problem viel trivialer ist...

  • Bin kein UNIX-Experte, aber ich hatte mal Probleme mit der Installation von Solaris. Ist ein oroginaler CD-Satz.

    Das Problem war letztendlich das CD-Laufwerk, daß die Umschaltung der Blockgröße nicht beherrschte.

    Die ersten Spuren hatten eine "normale" Blockgröße. Beim "Rest" waren sie größer.

  • Hmmm, hmmm, hmmm. Ok, Sun Fire mit (A)LOM / Systemconsole. Kann mir nur noch vorstellen das das (A)LOM merkwürdige boot parameter setzt (unwahrscheinlich, würde man sehen...). Dafür müsste man den gesamten Output vom einschalten des Systems sich ansehen oder in (A)LOM wechseln ( "#.", hash punkt war das glaube ich ...) und da mal schauen.

    Die SunFire V120 (bzw. Netra V120) hatten noch kein ALOM, sondern nur das alte LOM.


    ALOM: "The ALOM System Controller and ALOM firmware combine the features of RSC and LOM, as well as adding several new features."


    Hier der Start von Debian 12 vom LOM im poweroff Modus aus.


    Das (A)LOM kann auch wieder komplett downgegraded werden. Dafür gibt/gab es spezielle CD/DVD die bei den Fire Systemen neben dem OS DVDs dabei waren. Evl. andere Sun Fire Besitzer fragen, online schauen. Habe aber das Gefühl das ich hier viel zu kompliziert denke und das Problem viel trivialer ist...

    So eine CD/DVD wäre sehr interessant.

  • Fast Data Access MMU Miss könnte auf einen RAM-Fehler hindeuten ... die Installation von Solaris 9/10 ist auf beiden V120 nicht möglich, Debian 12 läuft jedoch?

    Ja



    memtest86+ gibt es in Debian 12 sparc64 nicht, welches man via Bootloader Menü starten könnte.

  • Solaris 10 zeugs habe ich leider nicht mehr. Vielleicht sind das ja passende images :https://mirror.math.princeton.edu/pub/opensolaris/2009/06/

    https://mirror.math.princeton.…9/06/osol-0906-hashes.txt


    Sparc gibt es hier nur "for Automated Installation service".

  • Bin kein UNIX-Experte, aber ich hatte mal Probleme mit der Installation von Solaris. Ist ein oroginaler CD-Satz.

    Das Problem war letztendlich das CD-Laufwerk, daß die Umschaltung der Blockgröße nicht beherrschte.

    Die ersten Spuren hatten eine "normale" Blockgröße. Beim "Rest" waren sie größer.

    Du könntest recht haben, Installationen von CD scheint zu funktionieren, nur bei DVDs scheint es ein Problem zu geben. Habe Solaris 8 auf CD ausprobiert - es gibt sonnst nur Solaris DVD images und siehe da:


    Auf dem Laufwerk in der V120 steht in großen Lettern "DVD".

  • Habe aber das Gefühl das ich hier viel zu kompliziert denke und das Problem viel trivialer ist...


    Ich hätte ja getippt, daß es mit der boot cdrom Variante und evtl dem - nowin Zusatz durchstartet. Scheint also doch was komplizierter zu sein.


    Memory läßt sich (zumindest auf den älteren geht das so) testen, von der OpenBoot Zeile aus mit "test /memory" (oder sowas). help test bringt Infos.

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • Installationen von CD scheint zu funktionieren, nur bei DVDs scheint es ein Problem zu geben


    Dann ist wahrscheinlich schlicht das DVD Laufwerk defekt. Kann man mal probieren zu Öffnen und die Linse mit Isopropanol oder Alkohol abzuwischen (vorsichtig, damit man sie nicht aus der gefederten Verankerung reißt).



    Das Logfile vom Solaris 8 hat aber schon auch ein paar Fehler ...

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • Nächstes Problem. Solaris 8 installation - wo ich gerade mal gelandet bin.

    Habe refurbish Sun Festplatte Typ Sub 36G in die V120 eingebaut. Laut Verkäufer:

    “vom Hersteller generalüberholt - neuwertig - 0 Betriebsstunden - Schriftliche Garantie - 3 Jahre !!!”

    Über smart konnte ich diese nicht in Linux überprüfen (kein smart support) - bei den anderen zwei HDs, die mit der V120 mitgeliefert wurden, war smart kein Problem.

    Dann beim booten mit der "neuen" HD:

    WARNING: Device sd0 failed to power up.

    WARNING: Please see your system administrator or reboot.

    Dann erzwungener Abbruch der Solaris 8 Installation zur Shell und mein Versuch die Platte zu Labeln (habe irgendwie in Erinnerung das dies wichtig ist):



    Den Sun Drive Typ SUN 36G scheint Solaris 8 nicht zu kennen. Auch sprechen die Fehlermeldungen für ein Problem mit der von mir erworbenen SUN Festplatte.

  • Daß smart nicht läuft kann normal sein. Das können erst die ganz großen "letzten" SCSI Platten.


    Das label läßt sich auch unter Linux schreiben. Mit parted und dort mklabel sun. Möglicherweise reicht das dem Installer dann schon. Ansonsten lassen sich natürlich auch die Partition so (extern) anlegen. Allerdings macht sich das im Installer einfacher, weil Sun da ein wenig eigene Vorstellungen hat, wie das auszusehen hat - was vorheriges aufwendiges Einlesen erfordert, wenn man das außerhalb eine Sun machen will. So gibt es etwa eine "gesamte Platte" Partition. Und die anderen möchten gern bestimmte Nummern haben.


    Und: man kann die Platte unter Linux mit badblocks testen. Wenn die da durchläuft ist sie eigentlich auch OK. (write Test dauert aber was)



    edit: guck vorher mal, ob die Version 8 die Maschine schon "richtig" unterstützt. Nicht, daß Du nachher doch lieber die 9 hättest, weil onboard-device xyz nicht läuft.

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • Die Platte hat offenbar eine Macke :( Dabei sieht diese so geil original aus - mit unterem Sun Schutzblech.

    Beim Debian booten kommt die verdächtige Meldung

    [ 125.072826] sd 2:0:1:0: [sdb] Asking for cache data failed


    v120:~ # lsblk

    NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTS

    sda 8:0 0 34.2G 0 disk

    ├─sda1 8:1 0 488.3M 0 part /boot

    ├─sda2 8:2 0 32.8G 0 part /

    ├─sda3 8:3 0 34.2G 0 part

    └─sda4 8:4 0 977.4M 0 part [SWAP]

    sdb 8:16 0 0B 0 disk

    sr0 11:0 1 1024M 0 rom


    Meine FUJITSU HD (/dev/sda), auf der Debian 12 läuft, ist soweit ok


    v120:~ # smartctl -a /dev/sda

    smartctl 7.4 2023-08-01 r5530 [sparc64-linux-6.9.11-sparc64] (local build)

    Copyright (C) 2002-23, Bruce Allen, Christian Franke, http://www.smartmontools.org


    === START OF INFORMATION SECTION ===

    Vendor: FUJITSU

    Product: MAN3367MC

    Revision: 5207

    User Capacity: 36,747,104,256 bytes [36.7 GB]

    Logical block size: 512 bytes

    Rotation Rate: 10025 rpm

    Serial number: UFD8P1C00SB9

    Device type: disk

    Local Time is: Sat Aug 3 23:23:53 2024 CEST

    SMART support is: Available - device has SMART capability.

    SMART support is: Enabled

    Temperature Warning: Disabled or Not Supported


    === START OF READ SMART DATA SECTION ===

    SMART Health Status: OK


    Die “vom Hersteller generalüberholt - neuwertig - 0 Betriebsstunden - Schriftliche Garantie - 3 Jahre !!!” ist /dev/sdb

    v120:~ # smartctl -a /dev/sdb

    smartctl 7.4 2023-08-01 r5530 [sparc64-linux-6.9.11-sparc64] (local build)

    Copyright (C) 2002-23, Bruce Allen, Christian Franke, http://www.smartmontools.org


    === START OF INFORMATION SECTION ===

    Vendor: SEAGATE

    Product: ST336607LSUN36G

    Revision: 0307

    Serial number: 3JA689VZ00007413473J

    Device type: disk

    Local Time is: Sat Aug 3 23:27:25 2024 CEST

    device is NOT READY (e.g. spun down, busy)

    A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.


    v120:~ # smartctl -T permissive -a /dev/sdb

    smartctl 7.4 2023-08-01 r5530 [sparc64-linux-6.9.11-sparc64] (local build)

    Copyright (C) 2002-23, Bruce Allen, Christian Franke, http://www.smartmontools.org


    === START OF INFORMATION SECTION ===

    Vendor: SEAGATE

    Product: ST336607LSUN36G

    Revision: 0307

    Serial number: 3JA689VZ00007413473J

    Device type: disk

    Local Time is: Sat Aug 3 23:29:25 2024 CEST

    device is NOT READY (e.g. spun down, busy)

    SMART support is: Unavailable - device lacks SMART capability.


    === START OF READ SMART DATA SECTION ===


    Current Drive Temperature: <not available>

    Drive Trip Temperature: 68 C


    Read defect list: asked for grown list but didn't get it

    Vendor (Seagate Cache) information

    Blocks sent to initiator = 0

    Blocks received from initiator = 0

    Blocks read from cache and sent to initiator = 0

    Number of read and write commands whose size <= segment size = 0

    Number of read and write commands whose size > segment size = 0


    Vendor (Seagate/Hitachi) factory information

    number of hours powered up = 0.20

    number of minutes until next internal SMART test = 120


    Error counter log:

    Errors Corrected by Total Correction Gigabytes Total

    ECC rereads/ errors algorithm processed uncorrected

    fast | delayed rewrites corrected invocations [10^9 bytes] errors

    read: 0 0 0 0 0 0.000 0

    write: 0 0 0 0 0 0.000 0


    Non-medium error count: 0


    No Self-tests have been logged


    Habe die Platte auf beiden HD-Slots der V120 getestet.

  • Guck mal die Kontakte genau(!) an.

    Auch an den Stellen, wo er angelötet ist, v.a. aber die im Anschluß selbst.

    Welche Kontakte? Die an der Festplatte? Die Anschlüsse (SCSI-Buchsen) in der V120 sollten kein Problem sein, da diese gut mit meinen anderen beiden SCSI Festplatten funktionieren. Leider habe ich keine anderen Systeme, mit den ich diese Ultra Wide SCSI 3 HD testen kann. Moderne USB HD Adapter decken nur EDI und SATA HDs ab.

  • Genau - die an der Platte. Nur mal schauen, ob die nicht evtl teils verbogen sind und ob alle gleiche Höhe haben. (Außerdem, ob die Lötkontakte alle stabil aussehen.)

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries

  • Dann ist wahrscheinlich schlicht das DVD Laufwerk defekt. Kann man mal probieren zu Öffnen und die Linse mit Isopropanol oder Alkohol abzuwischen (vorsichtig, damit man sie nicht aus der gefederten Verankerung reißt).



    Das Logfile vom Solaris 8 hat aber schon auch ein paar Fehler ...


    Sicher hat Du recht.


    [ 52.113549] I/O error, dev sr0, sector 1206992 op 0x0:(READ) flags 0x80700 phys_seg 1 prio class 0

    [ 59.147964] I/O error, dev sr0, sector 1204944 op 0x0:(READ) flags 0x80700 phys_seg 1 prio class 0

    [ 67.747879] I/O error, dev sr0, sector 1204944 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0

    [ 67.861332] Buffer I/O error on dev sr0, logical block 75309, async page read

    [ 76.416016] I/O error, dev sr0, sector 1205760 op 0x0:(READ) flags 0x80700 phys_seg 3 prio class 0

    [ 85.032767] I/O error, dev sr0, sector 1205760 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0

    [ 85.146160] Buffer I/O error on dev sr0, logical block 75360, async page read

    [ 91.762211] I/O error, dev sr0, sector 1206976 op 0x0:(READ) flags 0x80700 phys_seg 1 prio class 0

  • Dann tausch das mal. Das sollte eigentlich schon ein "normales" Notebooklaufwerk sein, nix Sun spezifisches. Trotzdem vorher mal in der Doku nach dem Typ sehen. ( FEH bei sun shrubbery net )

    -- 1982 gab es keinen Raspberry Pi , aber Pi und Raspberries