Fonctionnalités générales :
- Nagios est un système de surveillance de services réseau (SMTP, HTTP…) et de ressources système (CPU, espace disque…).
- Plus précisément, dans la terminologie Nagios, il s’agit de monitorer des services et des hosts, chaque service étant affecté à un host ou à un groupe de hosts. A un instant t, un host se trouve dans un état down, unreachable ou ok, et un service dans un état critical, warning, unknown ou ok.
- Conceptuellement, Nagios est un moteur :
- d’acquisition d’états de hosts et de services (checks),
- de déclenchement conditionnel d’actions préventives et curatives (handlers), et
- de déclenchement conditionnel de notifications.
- Ces acquisitions, actions et notifications sont assurées par des plugins.
- L’outil s’adresse aussi bien à de petites infrastructures (une dizaine de service) qu’à des architectures conséquentes (plusieurs milliers de serveurs repartis sur plusieurs sites) pour lesquelles il propose un modèle de supervision distribuée.
- Nagios offre une interface web de surveillance des services/hosts monitorés (tableau de bord), qui permet également l’administration partielle du serveur.
Limitations, difficultés, fonctionnalités importantes non couvertes:
Nagios ne garde pas d’historique des changements d’état (mis à part dans ses logs). Son interfaçage avec un outil comme RRDtool peut, de ce point de vue, se révéler judicieux, pour créer des graphes représentant l’évolution des valeurs d’acquisition au cours du temps.