VMWare Host hardware Monitoring

  • Hallo Leute,

    wie bekomme ich auf einem VMware ESXi Host ein hardware Monitoring zum laufen?

    Dazu finde ich zwar einiges, aber ich steige da einfach nicht durch.

    Mir raucht der Kopf, und ich finde keinen Zugang zum Thema.

    Hardware ist HP Proliant DL360p G8.

    Installiert ist das letzte dafür freigegebene angepasste ESXi Image (6.5U3).

    Hat da jemand den Durchblick?

    +++ ATH

  • Wie würde man da bei einem standalone Server an einem Standort, der ausschließlich über Internet erreichbar ist, vorgehen?

    SNMP über iNET, oder in einer VM auf dem zu überwachenden Host?

    Welche Software (Freeware) wäre da zu empfehlen?

    +++ ATH

  • Das ILO 4 hat eine eigene Netzwerkschnittstelle (das ist ein TP-Port ziemlich in der Mitte hinten) und eine separate IP-Adresse. Darauf läuft ein Web-Server, wo du dich mit einem Browser draufsetzen kannst, danach ist's eigentlich selbsterklärend. Es gibt auch spezielle clients für ILO (z.B. eine Mobile-App). Weg-Browser ist aber erstmal am einfachsten. ILO zeigt ziemlich viele mögliche Hardware-Probleme an, allerdings alarmiert es nicht. (Ausserdem hatte ILO4 einige Zeit eine Sicherheitsläcke, mit der böse Jungs die Maschine übernehmen konnten.).


    ILO hat allerdings lizenzpflichtige Komponenten, so dass möglicherweise nicht alles auf deiner Maschine funktioniert.

  • Daß ich im iLO nachsehen kann, ob alles OK ist, ist klar - damit arbeite ich seit etlichen Jahren.

    Das nützt mir aber nicht viel - ich muß auch eine Benachrichtigung (Mail) erhalten, wenn was ausfällt.

    Auf den Servern, die unter Windows laufen, richte ich das Monitoring mit der HP System Management Homepage ein.

    Eine iLO advanced Lizenz ist natürlich installiert. Da der Zugang zur Maschine ziemlich aufwendig ist, ist das unverzichtbar.

    +++ ATH

  • Dann würde ich einen lokalen SNMP-Trapfänger (z.B. mit NetSNMP) einrichten, der die SNMP-Traps auf der Maschine fängt und mit einem simplen Script eine e-Mail draus macht. Ohne einen dauerhaft stehenden Tunnel kannst du ansonsten mit SNMP nicht viel anfangen. Ein passendes (Perl)-Skript für snmtrapd könnte z.B. so aussehen (Je nach gewünschtem Luxus kann man den Trap-Inhalt beim "parse here" noch weitläufig aufhübschen und natürlich muß Mail auf dem Rechner auch eingerichtet sein und funktionieren):


    Code
    use strict;
    use SNMP::Trapinfo;
    my $trap = SNMP::Trapinfo->new(*STDIN, {hide_passwords => 1});
    # parse trap here
    my $subject = "Got trap from $trap->hostname";
    open EMAIL, "|-", "/usr/bin/mail", "-s", $subject, "me@mydomain.com";
    print EMAIL "My Email Body for SNMP Trap";
    close EMAIL;

    (Dazu braucht man natürlich Perl und das SNMP-Paket dazu.) Möglicherweise möchtest du auch ein paar Filterfunktionen in das Skript einbauen, weil SNMP-Agenten ziemlich gesprächig sein können. Damit der lokale Traphandler das auch passend verarbeitet, müsste er so gestartet werden:


    Code
    traphandle default /usr/local/bin/trapscript.pl

    Dafür brauchst du snmptrapd von da: http://www.net-snmp.org


    Der Host muss natürlich so eingerichtet sein, dass der lokale SNMP-Agent auch läuft und sich selbst als Trap-Destination eingerichtet hat. Dazu muss man ein paar Files unter /etc/rc.config-d/Snmp* und /etc/SnmpAgent.d/snmpd.conf passend anfassen. Das sollte aber in den manpages bzw. den Files selbst ziemlich gut beschrieben sein.


    Diesen ganzen Klumpatsch in vmware in eine eigene VM zu packen dürfte die ganze Sache nur unnötig verkomplizieren. Ich würde das Zeug direkt "nativ" auf dem Host einrichten.

  • Wenn du mehrere HP Server überwachen willst, kannst du auch HP OpenView nehmen. Da gibt es einige Möglichkeiten der Überwachung. Und wenn du noch HP Supportverträge hast, dann kommt der Anruf von HP schneller als die Mail vom OpenView :)


    --

    Elaay (aka WStyle) - Commodore 4 Ever !


    there are 10 types of people in this world, those who understand binary and those who dont

  • Ich bin ein großer Fan von check_mk https://checkmk.com/de


    Damit könntest Du auf dem ESX Server eine Linux VM laufen lassen und diese überwacht den ESX Host wahlweise über SNMP oder / und über das passende check_mk plugin https://checkmk.com/de/integrations?tags=vsphere


    Natürlich ist es nicht die allerbeste Idee von einem Monitoring abhängig zu sein, welche auf dem zu überwachenden Hosts läuft. Aber das wäre dann wenigestens noch standalone.

    Alternativ kann man die check_mk Instanz auch auf einem Server im Internet laufen lassen und von dort aus den DL 360 überwachen. Das sollte dann aber auf einem sicheren Weg wie z.B. Client Zertifikate, IP Whitelist oder Tunnel geschehen


    obbi

  • Kann man nicht mit dem passenden ESXi Modul auf die Hardware durchgreifen?

    Soweit ich mich erinnere, haben wir so unser Hardware Monitoring der Hosts aufgesetzt.


    Theoretisch sollte auch ein Durchreichen der Hardware an eine Linux VM gehen, das hatten wir mE mal vor langer Zeit getestet.

  • CheckMK in einer VM hört sich gut an.

    Oder du nimmst Proxmox statt Vmware. Da kannst du die Hardware direkt aus dem Linux überwachen.
    Eine Vmware mit der freien Lizenz kann sowieso nix was Spaß macht.

  • Meine eher obszöne Idee: Xymon - ist schlank, einfach zu konfigurieren und leicht zu erweitern. Den verwende ich auch für den Vereinsserver.


    Für das Zusammenspiel mit VMWare gibt's ein paar Links:

    Xymon Client for ESXi: Monitoring the VMWare Hypervisor
    Learn how I created a native Xymon monitor for VMWare ESXi that uses Python to run as a service directly on ESXi itself. It can be installed as a VIB package…
    devops.mentacityventures.com

    VMware vCenter and ESXi monitoring with Xymon
    We currently have a Windows vCenter for which I have written a few scripts for various monitoring with Xymon. We are moving to a vCenter Appliance and I need…
    serverfault.com


    Ob das wirklich gut geht, weiss ich nicht, ich habe kein ESXi mehr am Laufen.

    Denn Feindschaft wird durch Feindschaft nimmermehr gestillt; Versöhnlichkeit schafft Ruh’ – ein Satz, der immer gilt. Man denkt oft nicht daran, sich selbst zurückzuhalten; Wer aber daran denkt, der lässt den Zorn erkalten. Sprüche von Buddha, aus dem ‹Dhammapada›.


    Mein Netz: Acorn | Atari | Milan | Amiga | Apple //e und IIGS | Macintosh | SUN Sparc | NeXT |SGI | IBM RS/6000 | DEC Vaxstation und Decstation| Raspberry Pi | PCs mit OS/2, BeOS, Linux, AROS, Windows, BSD | Stand-alone: Apple //c und III | Commodore 128D | Sinclair QL | Amstrad | PDAs

  • Vorhin ist mir das iLO bei einer Konfigurationsänderung komplett abgeschmiert.

    Das iLO Netzwerkinterface hat keine Verbindung mehr aufgebaut.

    Beim POST für's iLO keine IP Adresse (unknown) angezeigt, und mit F8 ging's auch nicht mehr ins Setup.

    Solche und ähnliche Probleme mit iLO 4 scheinen nach den Suchtreffern im Netz recht häufig zu sein.

    Dementsprechend findet sich eine unübersichtliche Menge Lösungsvorschläge.

    Ein paar davon:- Natürlich erstmal den Server für ein paar Minuten komplett stromlos gemacht. Hat nicht geholfen.

    - Die UID Taste min. 10 Sekunden lang gedrückt halten - löst einen iLO Reset aus. Auch kein Erfolg.

    - Die iLO Firmware aus dem installierten ESXi heraus neu geflasht. Ebenfalls nix.

    Einige Suchtreffer sind hier schon am Punkt 'replace system Board'.

    Aber manch einer berichtete, daß er mit einem neuen Board nach kurzer Zeit wieder den gleichen Ärger hatte.

    Also weitergesucht, und auf eine weitere Lösung gestoßen:

    - Im intelligent Provisioning unter Wartung die iLO Konfiguration auf Werkseinstellungen zurückgesetzt.

    Damit lief es dann endlich wieder.

    Dann kann ich mich morgen hoffentlich nochmal dem eigentlichen Thema widmen...

    +++ ATH