Bonjour à tous.

Afin de ne pas arriver les lundis matin et de se faire tomber dessus par toute l’entreprise, il est bon de connaitre son infrastructure et de savoir ce qui risque de nous claquer dans les pattes.

La supervision est un élément indispensable dans un SI au risque d’avancer à l’aveugle, et surtout de sortir la carte superpouvoir « Les imprimantes marchent pas !!!
« … Je sais ! »

Ca fait toujours son petit effet.

Lors de ma reconversion, je m’etais orienté vers la solution Nagios. C’est moche, mais c’est libre, c’est léger et apres 466 jours sans pannes sur le serveur Nagios en lui même, c’est assez fiable.

Je ne reviendrais pas sur la configuration et l’installation de Nagios d’autres le font mieux que moi, mais par contre sur l’automatisations des alertes Nagios via mail.

Configuration initiale

Avant de commencer, assurez-vous que Nagios est installé et opérationnel sur votre serveur. Vous pouvez généralement trouver les fichiers de configuration dans le répertoire. Il n’est pas toujours au même endroit. pour ma part il se trouve dans :

/usr/local/nagios/etc/

Plan de bataille.

alors, on va dans l’ordre vérifier plusieurs chose.

  • un système de mail qui marche : postfix ou mail
  • configuration du mail qui va recevoir les notifications dans contact.cfg
  • configuration des alertes sur la machine à superviser

Installation service de mail

Ca marche pas ! m’exclamait-je alors que mon mail était bon. Oui, mais il serait bon d’installer les services qui vont bien

Tout d’abord un petit update/upgrade

sudo apt update
sudo apt upgrade

ensuite on va installer postfix qui est un agent de transport de courrier (MTA) qui envoie les emails. Il gère la réception et l’envoi des messages.

sudo apt install postfix

vous arriverez sur un écran d’installation et la il faut choisir « site internet »

et sur le deuxième écran, vous renseignez votre FQDN qui pour moi est

nagios.le-techromancien.fr
mais ça pourrait être également
nagios.entreprise.local en fonction de votre environnement

Et pour terminer, on va faire un test d’envoi pour valider notre installation

echo "Ceci est un test de Postfix" | mail -s "Test de Postfix" votre_adresse@example.com

C’est OK pour moi pour cette partie, on peut passer à la suite

configuration du mail à utiliser

dans vos différents éléments de configuration qui se situent dans /chemin/vers/objects
vous avez un fichier contact.cfg

Avant toute configuration, je vous encourage à faire une copie du fichier original permettant un rollback rapide si d’aventures nagios ne redémarrait pas. Je copie en .bak, parfois également en .ok quand je sais que ma conf est bonne.

cp contacts.cfg contacts.cfg.bak

ensuite voila le contenu du fichier

nano contacts.cfg
###############################################################################
#
# CONTACTS
#
###############################################################################

# Just one contact defined by default - the Nagios admin (that's you)
# This contact definition inherits a lot of default values from the
# 'generic-contact' template which is defined elsewhere.

define contact {

    contact_name            nagiosadmin             ; Short name of user
    use                     generic-contact         ; Inherit default values from generic-contact template (defined above)
    alias                   Nagios Admin            ; Full name of user
    email                   votre_adresse@mail.com ; <<***** CHANGE THIS TO YOUR EMAIL ADDRESS ******
}

comme dicté dans le fichier, modifiez l’e-mail pour que cela point vers votre mail, ou sur le mail du service informatique par exemple.

comme à chaque modification, redémarrez le service afin de prendre en compte les changements

systemctl restart nagios

Si vous avez une erreur lors du redémarrage, vous pouvez soit recopier votre fichier à un moment antérieur, soit essayer de résoudre le problème via les informations du serveur.
D’expérience, il est parfois plus simple de repartir sur son fichier fonctionnel que de retrouver la parenthèse qu’on a oublié ligne 274 😉

Astuces diverses

« Au secours !!! je reçois plein de notif !!! »

Effectivement, ensuite il faut savoir quoi superviser. Au moment d’écrire cet article, j’avais des switchs hors de l’infra mais que j’avais laissé dans les fichiers de conf.

pour annuler l’envoi d’une notification d’erreur, au lieu de supprimer le périphérique de la conf vous pouvez opter pour ceci

define host {

    use                     generic-switch                      ; Inherit default values from a template
    host_name               sw-srv-bas-24p                      ; The name we're giving to this switch
    alias                   HP ProCurve Serveur Bas             ; A longer name associated with the switch
    address                 192.168.10.xx                       ; IP address of the switch
    hostgroups              switches                            ; Host groups this switch is associated with
    notifications_enabled 0
}

Ressources

By jack

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *