Communication et gestion des alertes

Communication et gestion des alertes

NMS dispose de tous les moyens spécifiques pour envoyer les alarmes sur les différents supports (consoles, mails, sms, intégration avec les outils de gestion de parc ou de helpdesk…).

NMS remonte des informations claires et précises par l'utilisation des méthodes suivantes :

  • Alerte au niveau de la console de supervision
  • Alerte envoyée par courrier électronique, via la sonde 'email Gateway' passerelle pour les mails
  • Alerte envoyée par sms, via la sonde 'sms Gateway' passerelle pour les sms

La communication des alertes s'effectue en standard selon un processus d'escalade fonction de sa sévérité ou de son origine technique.
NMS permet de visionner les alarmes en temps réel sur les différentes consoles et Tableaux de bord grâce à  l"'Alarm Subconsole " qui s'intègre dans la partie basse des fenêtres principales.

NMS dispose en standard dans son infrastructure d'un serveur d'alertes dont le rôle est de gérer les alertes, leur corrélation, escalade, envoi d'emails, envoi de SMS…
Au sein de ce serveur d'alertes, il est possible de définir tout type d'action en réalisant un script. Le langage proposé par défaut est LUA mais tout autre langage de programmation peut-être utilisé. NMS est livré avec des bibliothèques d'exemples.

NMS offre en standard l'ensemble des possibilités suivantes :

  • Un filtrage des alertes qui se fait aussi bien sur le niveau des alertes (gravité), que sur l'origine de l'alerte (Machine source, IP, …),  sur la catégorie d'alerte (système, réseau, base de données …), ou sur la nature du message d'alerte (par expression régulière) etc…
  • Le paramétrage d'une alerte sur la base de plusieurs conditions (l'alerte n'est générée que si elle remplit plusieurs conditions). Ce type de paramétrage permet la mise en place d'objectifs d'alertes selon des critères d'engagement de service (SLA) pris avec le client
  • Une activation/désactivation des alertes, rendue possible en fonction de plages horaires, ou de dates (arrêter la surveillance durant une période donnée pour des problématiques de sauvegarde ou arrêt des services par exemple)
  • Une capacité de passer les serveurs en mode maintenance, qui permet dans ce cas d'inhiber la surveillance.
  • Une capacité à agir en fonction d'une alerte : la sonde permet d'effectuer n'importe quelle type d'action (fermeture, escalade, assignation, attacher une note, executer une commande ou un script, envoi de mail ou sms, …)

Au niveau de la console de gestion de la qualité de service, il est possible de paramétrer la surveillance du respect des engagements des SLA mais aussi des SLO, sous la forme d'envoi d'alerte sur franchissement d'un seuil (Exemple : envoi d'une alerte dès que la disponibilité du service de messagerie est inférieure à 99,67%, alors que l'objectif est de 99,80%)

Au sein de la console Infrastructure Manager, qui permet l'administration complète de l'infrastructure NMS,  il est possible de gérer pour chaque serveur les services (arret/redemarrage), ou les processus (Arret).

Tout ce qui peut être mis en place sur les alarmes (filtrage, envoi de mail, déclenchement de script etc…) peut être assujetti à des plages horaires.

NMS permet via les sondes logmon et ntevl de surveiller le bon fonctionnement des applicatifs en analysant les fichiers log et les journaux d'événements. Il est aussi de possible de gérer les événements applicatifs via les trap SNMP ou les WMI.

NMS peut, effectivement, identifier d'où provient un dysfonctionnement pour une application hébergée en externe ou chez un partenaire, mais aussi une dégradation de l'accès par rapport au temps de réponse des services externalisés.
L'ensemble des informations (alertes et mesures) produites par l'outil est stocké dans la base de données.

Le filtrage des alertes peut être mis en œuvre en fonction du type de message, de la machine source, de la date, du nombre d'émission, etc.
L'escalade des alertes est paramétrable en fonction de critères divers: nombre, temps, niveau de qualité de service…

NMS permet de gérer des objectifs de qualité de service complexes, avec des algorithmes de calcul et de pondération des différents éléments mesurés.
 

Tests et mesures du fonctionnement des applications

NMS permet de contrôler le bon fonctionnement d'une application, au travers de tests de simulation.
Grâce à ces tests ou peut analyser un comportement applicatif et transactionnel, jouer et rejouer des scénarios utilisateurs permettant un diagnostic applicatif précis.

Cette approche " End to End utilisateur " permet de créer facilement des scenarii afin de déterminer le temps de réponse des diverses applications et d'envoyer une alarme en cas de dysfonctionnement ou de comportement inattendu. Cette fonction est utile pour des applications Web, en client lourd, ou au travers des serveurs de type citrix ou tse …

Il est d'ailleurs possible d'intégrer des points de contrôle ou bien d'enregistrer les temps intermédiaires à tout moment dans le scénario.

Pour assurer les besoins de visibilité temps réel, nous pouvons aussi par simulation, disposer d'une visibilité sur une requête ou transaction en cours. L'ensemble des éléments mesurés est stocké dans la base de données permettant toute analyse (impact, montée en charge, erreur).