VMWare Host hardware Monitoring

**Toast_r** · 29. Dezember 2023

Hallo Leute,

wie bekomme ich auf einem VMware ESXi Host ein hardware Monitoring zum laufen?

Dazu finde ich zwar einiges, aber ich steige da einfach nicht durch.

Mir raucht der Kopf, und ich finde keinen Zugang zum Thema.

Hardware ist HP Proliant DL360p G8.

Installiert ist das letzte dafür freigegebene angepasste ESXi Image (6.5U3).

Hat da jemand den Durchblick?

trazom · 29. Dezember 2023

Üblicherweise macht man das über das ILO Board vom HP Proliant.
Da kann man per SNMP die Hardware überwachen. Da gibt es Plugins für alle namhaften Monitoring Programme.

**Toast_r** · 29. Dezember 2023

Wie würde man da bei einem standalone Server an einem Standort, der ausschließlich über Internet erreichbar ist, vorgehen?

SNMP über iNET, oder in einer VM auf dem zu überwachenden Host?

Welche Software (Freeware) wäre da zu empfehlen?

tofro · 29. Dezember 2023

Das ILO 4 hat eine eigene Netzwerkschnittstelle (das ist ein TP-Port ziemlich in der Mitte hinten) und eine separate IP-Adresse. Darauf läuft ein Web-Server, wo du dich mit einem Browser draufsetzen kannst, danach ist's eigentlich selbsterklärend. Es gibt auch spezielle clients für ILO (z.B. eine Mobile-App). Weg-Browser ist aber erstmal am einfachsten. ILO zeigt ziemlich viele mögliche Hardware-Probleme an, allerdings alarmiert es nicht. (Ausserdem hatte ILO4 einige Zeit eine Sicherheitsläcke, mit der böse Jungs die Maschine übernehmen konnten.).

ILO hat allerdings lizenzpflichtige Komponenten, so dass möglicherweise nicht alles auf deiner Maschine funktioniert.

**Toast_r** · 29. Dezember 2023

Daß ich im iLO nachsehen kann, ob alles OK ist, ist klar - damit arbeite ich seit etlichen Jahren.

Das nützt mir aber nicht viel - ich muß auch eine Benachrichtigung (Mail) erhalten, wenn was ausfällt.

Auf den Servern, die unter Windows laufen, richte ich das Monitoring mit der HP System Management Homepage ein.

Eine iLO advanced Lizenz ist natürlich installiert. Da der Zugang zur Maschine ziemlich aufwendig ist, ist das unverzichtbar.

tofro · 29. Dezember 2023

Dann würde ich einen lokalen SNMP-Trapfänger (z.B. mit NetSNMP) einrichten, der die SNMP-Traps auf der Maschine fängt und mit einem simplen Script eine e-Mail draus macht. Ohne einen dauerhaft stehenden Tunnel kannst du ansonsten mit SNMP nicht viel anfangen. Ein passendes (Perl)-Skript für snmtrapd könnte z.B. so aussehen (Je nach gewünschtem Luxus kann man den Trap-Inhalt beim "parse here" noch weitläufig aufhübschen und natürlich muß Mail auf dem Rechner auch eingerichtet sein und funktionieren):

Code

use strict;
use SNMP::Trapinfo;
my $trap = SNMP::Trapinfo->new(*STDIN, {hide_passwords => 1});
# parse trap here
my $subject = "Got trap from $trap->hostname";
open EMAIL, "|-", "/usr/bin/mail", "-s", $subject, "me@mydomain.com";
print EMAIL "My Email Body for SNMP Trap";
close EMAIL;

(Dazu braucht man natürlich Perl und das SNMP-Paket dazu.) Möglicherweise möchtest du auch ein paar Filterfunktionen in das Skript einbauen, weil SNMP-Agenten ziemlich gesprächig sein können. Damit der lokale Traphandler das auch passend verarbeitet, müsste er so gestartet werden:

Code

traphandle default /usr/local/bin/trapscript.pl

Dafür brauchst du snmptrapd von da: http://www.net-snmp.org

Der Host muss natürlich so eingerichtet sein, dass der lokale SNMP-Agent auch läuft und sich selbst als Trap-Destination eingerichtet hat. Dazu muss man ein paar Files unter /etc/rc.config-d/Snmp* und /etc/SnmpAgent.d/snmpd.conf passend anfassen. Das sollte aber in den manpages bzw. den Files selbst ziemlich gut beschrieben sein.

Diesen ganzen Klumpatsch in vmware in eine eigene VM zu packen dürfte die ganze Sache nur unnötig verkomplizieren. Ich würde das Zeug direkt "nativ" auf dem Host einrichten.

Elaay · 29. Dezember 2023

Wenn du mehrere HP Server überwachen willst, kannst du auch HP OpenView nehmen. Da gibt es einige Möglichkeiten der Überwachung. Und wenn du noch HP Supportverträge hast, dann kommt der Anruf von HP schneller als die Mail vom OpenView

**Toast_r** · 29. Dezember 2023

Es geht um einen standalone Server, der als Hobbyprojekt betrieben wird.

obbi · 29. Dezember 2023

Ich bin ein großer Fan von check_mk https://checkmk.com/de

Damit könntest Du auf dem ESX Server eine Linux VM laufen lassen und diese überwacht den ESX Host wahlweise über SNMP oder / und über das passende check_mk plugin https://checkmk.com/de/integrations?tags=vsphere

Natürlich ist es nicht die allerbeste Idee von einem Monitoring abhängig zu sein, welche auf dem zu überwachenden Hosts läuft. Aber das wäre dann wenigestens noch standalone.

Alternativ kann man die check_mk Instanz auch auf einem Server im Internet laufen lassen und von dort aus den DL 360 überwachen. Das sollte dann aber auf einem sicheren Weg wie z.B. Client Zertifikate, IP Whitelist oder Tunnel geschehen

obbi

c900 · 29. Dezember 2023

Kann man nicht mit dem passenden ESXi Modul auf die Hardware durchgreifen?

Soweit ich mich erinnere, haben wir so unser Hardware Monitoring der Hosts aufgesetzt.

Theoretisch sollte auch ein Durchreichen der Hardware an eine Linux VM gehen, das hatten wir mE mal vor langer Zeit getestet.

trazom · 29. Dezember 2023

CheckMK in einer VM hört sich gut an.

Oder du nimmst Proxmox statt Vmware. Da kannst du die Hardware direkt aus dem Linux überwachen.
Eine Vmware mit der freien Lizenz kann sowieso nix was Spaß macht.

**yalsi** · 29. Dezember 2023

Meine eher obszöne Idee: Xymon - ist schlank, einfach zu konfigurieren und leicht zu erweitern. Den verwende ich auch für den Vereinsserver.

Für das Zusammenspiel mit VMWare gibt's ein paar Links:

Xymon Client for ESXi: Monitoring the VMWare Hypervisor

Learn how I created a native Xymon monitor for VMWare ESXi that uses Python to run as a service directly on ESXi itself. It can be installed as a VIB package…

devops.mentacityventures.com

VMware vCenter and ESXi monitoring with Xymon

We currently have a Windows vCenter for which I have written a few scripts for various monitoring with Xymon. We are moving to a vCenter Appliance and I need…

serverfault.com

Ob das wirklich gut geht, weiss ich nicht, ich habe kein ESXi mehr am Laufen.

**Toast_r** · 30. Dezember 2023

Vorhin ist mir das iLO bei einer Konfigurationsänderung komplett abgeschmiert.

Das iLO Netzwerkinterface hat keine Verbindung mehr aufgebaut.

Beim POST für's iLO keine IP Adresse (unknown) angezeigt, und mit F8 ging's auch nicht mehr ins Setup.

Solche und ähnliche Probleme mit iLO 4 scheinen nach den Suchtreffern im Netz recht häufig zu sein.

Dementsprechend findet sich eine unübersichtliche Menge Lösungsvorschläge.

Ein paar davon:- Natürlich erstmal den Server für ein paar Minuten komplett stromlos gemacht. Hat nicht geholfen.

- Die UID Taste min. 10 Sekunden lang gedrückt halten - löst einen iLO Reset aus. Auch kein Erfolg.

- Die iLO Firmware aus dem installierten ESXi heraus neu geflasht. Ebenfalls nix.

Einige Suchtreffer sind hier schon am Punkt 'replace system Board'.

Aber manch einer berichtete, daß er mit einem neuen Board nach kurzer Zeit wieder den gleichen Ärger hatte.

Also weitergesucht, und auf eine weitere Lösung gestoßen:

- Im intelligent Provisioning unter Wartung die iLO Konfiguration auf Werkseinstellungen zurückgesetzt.

Damit lief es dann endlich wieder.

Dann kann ich mich morgen hoffentlich nochmal dem eigentlichen Thema widmen...