Contacts
  • Backoffice: ITsense UG (haftungsbeschränkt) Am Ausjagbogen 38 82256 Fürstenfeldbruck Main Office: ITsense UG (haftungsbeschränkt) Fürstenfeldbruckerstr. 14 82272 Fürstenfeldbruck
  • +49 8141 509 123 40
  • info@itsense.de

Wir setzen für unsere Kunden nach Möglichkeit Monitoringsysteme ein. Der Grund dafür ist ganz einfach, wir möchten gerne vor unseren Kunden wissen wenn bei deren IT etwas nicht korrekt läuft damit wir es am besten auch bevor der Kunde davon aktiv betroffen ist lösen können. Genau, das ist unser Verständnis von IT-Wartung und IT-Betrieb.

Was aber wenn das Monitoring plötzlich Alarm schlägt?

Erst einmal Ruhe bewahren und den Fall prüfen 🙂 – Beim vorliegenden Fall war es zuerst ein wenig kurios. Ein Kundenserver war „angeblich“ down. Er wurde im Monitoring als „not reachable“ angezeigt, also erhielten wir kein ICMP Echo (Ping wurde vom Monitoring Richtung Kundenserver geschickt aber nicht erwidert). Daraufhin folgte eine festgelegte Aktionskette zur Eingrenzung des Problems, letztlich kam dabei heraus:

Monitoring -> Kundenserver -> kein ICMP Response

Anderer Server -> Kundenserver -> ICMP Response

Firewallprobleme am Kundenserver?

Zuerst leiteten uns die Ergebnisse der Untersuchungen in Richtung „am Kundenserver wurde etwas verändert das zur Sperrung des Monitoringservers geführt hat“. Einige Logfiles, Firewalleinstellungen und IPS-Settings später war jedoch klar dies war nicht der Grund warum unser Monitoring sagte der Kundenserver sei nicht erreichbar.

ARP sei Dank...

Langsam kamen wir der Sache auf die Spur, wenn es nicht der Kundenserver war musste bei uns am Monitoring etwas geändert worden sein. Betroffen war unter vielen Systemen (von anderen Kunden und dem Betroffenen) lediglich ein Server. Wir prüften daher die ARP Tabelle und konnten dabei feststellen das dort eine andere MAC-Adresse als die tatsächliche für den betroffenen Kundenserver eingerichtet worden war.

Damit war die Sache klar, die im ARP-Cache des Monitoringservers falsch eingetragene Hardware-Adresse (MAC) führte dazu das unser Monitoring für diesen Server nicht mehr korrekt arbeiten konnte. Das löschen des betroffenen ARP-Eintrages löste das Problem und der Kundenserver war wieder für unser Monitoring erreichbar.

Für manche mögen solche Probleme purer Stress sein oder man könnte gar denken – das sind voll die Nerds …. und hey, ja, das sind wir, und das gesamte Team hat Freude und Spaß dabei! Wir lösen auch deine kniffligen Fälle, falls Du also ein Serverproblem hast oder deine Telefonanlage nicht mehr mag. Ja, sogar wenn Du einfach nur auf der Suche nach einem IT-Partner bist der das Motto „Menschlich und kompetent“ auch lebt dann kontaktiere uns gerne, wir freuen uns!

Lösung des Problems im Schnelldurchlauf

    1. Prüfe den ARP Cache mit dem Linux-Kommando: arp
    2. Lösche den betroffenen Eintrag mit: arp -d <hostname>
    3. Prüfe ob die IP/Hostname nun wieder erreichbar ist.