Linux Network Monitoring

Monitoring Distribuito

Controllo e monitoraggio dell’infrastruttura ict aziendale

Per un IT manager è ormai di fondamentale importanza poter prevenire le problematiche ed identificare in pochi istanti dove sia collocato il problema.

I Sistemi di Monitoring distribuito permettono di tenere sotto controllo l’intera struttura ICT aziendale, in modo automatico.

Thesis Technology ha pacchettizzato un sistema basato su piattaforma Linux per il moniotring distribuito dell’infrastruttura di rete aziendale. Tale Sistema è la risultante di un insieme di software e plug-in con, avente come centro funzionale il sistema Nagios.

Nagios è una nota applicazione opensource per il monitoraggio di computer e risorse di rete. La sua funzione base è quella di controllare nodi, reti e servizi specificati, avvertendo quando questi non garantiscono il loro servizio o quando ritornano attivi.

Di seguito le principali caratteristiche del sistema:

  • Monitoraggio di servizi di rete (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, FTP, SSH)
  • Monitoraggio delle risorse di sistema (carico del processore, uso dell’hard disk, log di sistema sulla maggior parte dei sistemi operativi, anche per Microsoft Windows NRPE_NT).
  • Monitoraggio remoto supportato attraverso SSH o SSL encrypted tunnels.
  • Semplici plugin che permettono agli utenti di sviluppare facilmente nuovi controlli per i servizi in base alle proprie esigenze, usando Bash, C++, Perl, Ruby, Python, PHP, C#, etc.
  • Controlli paralleli sui servizi.
  • Capacità di definire gerarchie di nodi di rete usando nodi “parent”, permettendo la distinzione tra nodi che sono down e nodi non raggiungibili.
  • Notifiche quando l’applicazione riscontra problemi o la loro risoluzione (via email, pager, SMS, o con altri sistemi per mezzo di plug-in aggiuntivi)
  • Capacità di definire “event handlers”, ovvero azioni automatiche che vengono attivate all’apparire o alla risoluzione di un problema.
  • Rotazione automatica dei file di log.
  • Supporto per l’implementazione di monitoring ridondato.
  • Interfaccia web opzionale per la visualizzazione dell’attuale stato, notifiche, storico dei problemi, file di log, etc.

Questa caratteristica permette di l’immediata individuazione del punto in cui si è verifica la problematica nonché l’individuazione preventiva di possibili crititcità.

I servizi applicativi possono essere tenuti sotto controllo con specifici plug-in ( smtp, pop3, imap, IIS, Mysql, Sql Server, etc..).

Tutti i parametri vitali fondamentali dei sistemi Server vengono continuamente controllati ( CPU, Memoria Utilizzata, Spazio disco, processi, et..)

E’ inoltre possibile creare statistiche e grafici di analisi dell livello di affidabilità e continuità dei diversi servizi aziendali.

Sistema di Alert ed Escalation

Grazie a questa interessante caratteristica è possibile identificare diversi livelli di intervento.

Quando un dispositivo esce fuori dai parametri di soglia configurati, il sistema avviserà un gruppo di amministratori.

Qualora il problema continui a persistere oltre un periodo di tempo stabilito, il dispositivo avvertirà un secondo gruppo di amministratori e così via sino ad un terzo livello.

Le notifiche potranno avvenire tramite :

  • Mail di Notifica Criticità/Problema

  • SMS di Notifica Criticità/Problema ( Sia tramite Sms Gateway che tramite modem GSM)

  • Chiamata tramite Combinatore telefonico.