tuxad.com

Linux Systemhaus Herford

Nagios, Performance Remote-Abfragen

Nagios ist eine Monitoringsoftware zur Server- und Serverdienste- Überwachung. Nagios ist beliebig erweiterbar und wird im professionellen Umfeld eingesetzt.

Zur Überwachung interner Parameter anderer Server in einem Netzwerk gibt es mehrere Möglichkeiten wie z.B. SNMP (Net-SNMP), was oft bereits installiert und im Einsatz ist, oder den Nagios-eigenen NRPE.

In einem Netz wurde ab ca. 100 bis 150 zu überwachenden Hosts die Last auf einem mit Linux betriebenen Nagios-Server, der per SNMP abfragt (Nagios check_snmp), etwas grösser (4-7). Damit verbunden war der subjektive Eindruck mangelhafter Performance. Weil auch der Verwaltungsaufwand aufgrund unterschiedlicher Versionen der Net-SNMP-Pakete auf verschiedenen Hosts höher war, wurde nach einer Alternative gesucht. Basierend auf der Idee eines kleinen http-Servers für eine DYNDNS-Implementierung (siehe txdyn) wurde http-Software für Nagios-Remotechecks entwickelt. Bei dieser Lösung kann auch eine SNMP bzw. MIB vergleichbare Baumstruktur verwendet werden wie z.B.

GET /diskfree/var/lib/mysql HTTP/1.1

Die Software war bereits im Produktiveinsatz, die Last des Nagios-Servers gesunken und die Performance war subjektiv gestiegen, als Tests die ersten Messergebnisse lieferten.

Die Daten der Tests:

  • Nagios+NRPE 2.10, Plugins 1.4.10
  • Nagios-Server 2xP4 3GHz
  • Host 1 und 2: Xeon 5120 1.86GHz 4 Cores
  • alle Linux 2.6, Etch bzw. Gentoo
  • Hosts zum Testzeitpunkt Last <1
  • GB-Ethernet, HP/Cisco GB Switches, lokales Netz
  • Testprogramm in C, fork()/execve() 5000 mal check_* Plugin aufgerufen
  • 4 Remotecheck-Varianten:
    • http, Serverprogramm in C, per tcpserver aufgerufen
    • http, Serverprogramm in Python als Daemon
    • Nagios NRPE
    • Net-SNMP 5.4.1, Nagios-Plugin check_snmp
  • Variante SNMP Testprogramm wurde 10x aufgerufen (=50000 Abfragen)
  • die anderen 3 jeweils direkt hintereinander und jeweils 50x
  • Überprüfung, ob keine fork() oder sonstigen Fehler auftraten
  • von den 50 bzw. 10 Aufrufen des Testprogramms wurde jeweils der kleinste "real"-Wert genommen
  • Host 1 und 2 lieferten vergleichbare Ergebnisse

Die Messwerte von "time" für 5000 Abfragen:

  • knoerre, http/C: 0m 2.487s
  • pyrre, http/Python: 0m 3.569s
  • NRPE: 0m 43.370s
  • SNMP: 8m 51.776s

Die http-Software und noch mehr befinden sich in einem Paket unter Download/ngtx.



Copyright © 2004-2013 Frank W. Bergmann
Alle Rechte vorbehalten. Rechtliche Hinweise

Keywords dieser Seite: Linux, Systemhaus, Herford, LPI, LPIC, LPIC-2, LPIC-3, zertifiziert, Zertifizierung, Linux-Systemhaus, Unix, Betriebssystem, Linux, Systementwicklung, Optimierung, Systemprogramme, Programmierung, Software-Entwicklung, Patches, System-Administration, Systemadministration, OpenSource, Performance, Monitoring-Spezialist, Monitoringsystem, Nagios, Monitoring, Nagios-Plugin, Nagios-Server, NRPE, SNMP, IT-Security, Nameserver, DYNDNS, Hosting, Webhoster, Webhosting-Unternehmen, Webserver, Domainhosting, Domains, Virtual-Root, VirtualRoot, Linux-Distribution, Linux-Software, Linux-System, Linux-Hosts, Mail-Server, Mailprovider, Mailserver, Spamschutz, DNSBL, Technische Dokumentation, Administration, Sicherheitskonzept, Software-Entwicklung, Softwareentwicklung, Softwareprojekt, Datenschutz, Datensicherheit, Distribution, GNU GPL, Hardware, Firewire, IT-Dienstleister, IT-Dienstleistung, Internet-Fullservice, Internetserver, Netzwerk, Netzwerkadministration, Netzwerkdienste, Netzwerke, Netzwerktechnik, Programm, Programmiersprachen, Projekt, Python, Risikoanalyse, Virtual-Root-Server, Router, SMTP-Relay, SNMP, Schulungen, Security, Server, Serverdienste, Spam-Empfang, Spam-Versand, Spamassassin, Spammer, Spammer-Datenbanken, Spammer-Netze, Spammerlisten, Spamtrap, Linux, DNS, DYNDNS, Monitoring, Monitoringsoftware, NRPE, Nagios-Plugin, Nagios-Remotechecks, Nagios-Server, Netzwerk, Performance, SNMP, Server, Serverdienste, Software, Linux-Systemhaus, Herford, Linux