Fenêtres de Maintenance : Silence Automatique des Alertes

Évitez les fausses alertes pendant vos maintenances planifiées avec des périodes de silence configurables.

Chaque déploiement, chaque mise à jour de serveur, chaque maintenance de base de données génère potentiellement des alertes. Ces alertes sont attendues - votre service est temporairement indisponible parce que vous l'avez planifié ainsi. Pourtant, sans configuration appropriée, ces alertes prévisibles polluent votre flux et créent de la fatigue d'alertes.

Les fenêtres de maintenance (maintenance windows) résolvent ce problème. Elles permettent de suspendre automatiquement les alertes pendant une période définie, évitant le bruit inutile tout en continuant à collecter les données de monitoring pour vos statistiques.

Ce guide vous montre comment configurer efficacement des fenêtres de maintenance dans MoniTao. Des maintenances ponctuelles aux déploiements récurrents, vous apprendrez à gérer proprement ces interruptions planifiées.

Qu'est-ce qu'une Fenêtre de Maintenance ?

Une fenêtre de maintenance est une période pendant laquelle le monitoring se comporte différemment :

  • Alertes suspendues : Aucune notification n'est envoyée pendant la fenêtre, même si le service est détecté comme indisponible. Votre équipe n'est pas dérangée pour un downtime planifié.
  • Monitoring actif : Les vérifications continuent d'être effectuées et les données sont enregistrées. Vous conservez la visibilité sur la durée réelle de l'indisponibilité.
  • Statistiques préservées : Les rapports de disponibilité peuvent inclure ou exclure les maintenances planifiées selon votre configuration. Distinguez le downtime planifié du downtime subi.
  • Reprise automatique : À la fin de la fenêtre, les alertes reprennent automatiquement. Si le service n'est pas revenu, vous êtes immédiatement notifié.

Quand Utiliser une Fenêtre de Maintenance ?

Les fenêtres de maintenance sont utiles dans de nombreux scénarios :

  • Déploiements récurrents : Votre équipe déploie chaque mardi à 10h ? Configurez une fenêtre hebdomadaire automatique de 10h à 11h chaque mardi.
  • Maintenance serveur : Mise à jour du système d'exploitation, redémarrage pour appliquer des patches. Créez une fenêtre ponctuelle couvrant la durée estimée.
  • Migration de base de données : Les migrations importantes peuvent nécessiter plusieurs heures. Une fenêtre de maintenance évite des dizaines d'alertes pendant l'opération.
  • Maintenance hébergeur : Votre hébergeur annonce une maintenance réseau samedi de 2h à 4h. Programmez une fenêtre correspondante pour tous les monitors concernés.
  • Tests de charge : Les tests de performance peuvent ralentir le service ou le rendre temporairement indisponible. Une fenêtre évite les fausses alertes de latence.

Configurer une Fenêtre de Maintenance

MoniTao permet de créer des fenêtres de maintenance de plusieurs façons :

  1. Maintenance ponctuelle : Depuis le dashboard, cliquez sur "Maintenance" puis "Nouvelle fenêtre". Définissez la date/heure de début et de fin, sélectionnez les monitors concernés.
  2. Maintenance récurrente : Cochez "Récurrente" et définissez le pattern (quotidien, hebdomadaire, mensuel). Par exemple : "Chaque mardi de 10h à 11h".
  3. Maintenance par tag : Appliquez la maintenance à tous les monitors d'un tag (ex: "production-web"). Les nouveaux monitors avec ce tag seront automatiquement inclus.
  4. Maintenance via API : Intégrez la création de maintenances dans vos scripts de déploiement. L'API MoniTao permet de créer une fenêtre juste avant un déploiement.

Exemples de Configuration

Voici des exemples de fenêtres de maintenance courantes :

# Maintenance récurrente pour déploiement hebdomadaire
maintenance:
  name: "Déploiement mardi"
  schedule: "0 10 * * 2"  # Mardi 10h (cron)
  duration: 60  # minutes
  monitors: ["tag:production"]

# Maintenance ponctuelle pour migration DB
maintenance:
  name: "Migration PostgreSQL 15"
  start: "2024-02-15 02:00:00"
  end: "2024-02-15 06:00:00"
  monitors: ["db-primary", "db-replica", "api-prod"]

# Maintenance hébergeur (notification reçue)
maintenance:
  name: "OVH Network Maintenance"
  start: "2024-02-17 03:00:00"
  end: "2024-02-17 05:00:00"
  monitors: ["tag:ovh-servers"]

Ces configurations montrent différents cas d'usage : récurrence cron pour les déploiements réguliers, fenêtre fixe pour les opérations ponctuelles, et application par tag pour les maintenances affectant un groupe de serveurs.

Types de Fenêtres de Maintenance

MoniTao supporte plusieurs types de fenêtres selon vos besoins :

  • Silence complet : Aucune alerte n'est envoyée quelle que soit la gravité. Option par défaut pour les maintenances planifiées.
  • Alertes critiques uniquement : Seules les alertes les plus graves (ex: timeout complet) sont envoyées. Utile pour détecter si une maintenance dépasse le prévu.
  • Monitoring suspendu : Les vérifications sont complètement arrêtées. Utile si les vérifications elles-mêmes interfèrent avec la maintenance.
  • Exclusion statistiques : Le downtime pendant la fenêtre n'est pas compté dans les statistiques de disponibilité. Vos SLA ne sont pas impactés par les maintenances planifiées.

Bonnes Pratiques

Optimisez l'usage de vos fenêtres de maintenance :

  • Marge de sécurité : Prévoyez une marge de 20-30% par rapport à la durée estimée. Un déploiement de 30 minutes mérite une fenêtre de 45 minutes.
  • Vérification post-maintenance : Configurez une vérification immédiate à la fin de la fenêtre pour détecter rapidement si le service n'est pas correctement revenu.
  • Communication équipe : Notifiez l'équipe quand une fenêtre de maintenance démarre. MoniTao peut envoyer un récapitulatif des monitors en maintenance.
  • Audit régulier : Passez en revue vos fenêtres récurrentes mensuellement. Les déploiements qui n'utilisent plus leur créneau habituel créent des fenêtres inutiles.

Checklist Maintenance Window

  • Identifier tous les monitors affectés
  • Définir une durée avec marge de sécurité
  • Choisir le type de silence approprié
  • Configurer la récurrence si applicable
  • Informer l'équipe de la fenêtre planifiée
  • Vérifier le retour à la normale après maintenance

Questions Fréquentes

Que se passe-t-il si ma maintenance dépasse la fenêtre prévue ?

À la fin de la fenêtre, le monitoring reprend normalement. Si le service est toujours down, une alerte est immédiatement envoyée. C'est pourquoi il est important de prévoir une marge de sécurité.

Puis-je étendre une fenêtre de maintenance en cours ?

Oui, depuis le dashboard ou via l'API, vous pouvez modifier l'heure de fin d'une maintenance en cours. L'extension est immédiatement prise en compte.

Les données sont-elles toujours collectées pendant une maintenance ?

Par défaut, oui. Les vérifications continuent et les données sont stockées. Vous pouvez consulter le comportement du service pendant la maintenance dans vos graphiques.

Comment gérer une maintenance urgente non planifiée ?

Créez une maintenance "instant" depuis le dashboard avec un clic. Vous pouvez aussi utiliser l'API pour automatiser cette création depuis vos scripts d'urgence.

Les fenêtres de maintenance affectent-elles les SLA ?

Vous pouvez choisir d'exclure les maintenances planifiées de vos calculs SLA. Les rapports distinguent alors le downtime planifié du downtime imprévu.

Puis-je annuler une maintenance planifiée ?

Oui, les maintenances peuvent être supprimées avant leur démarrage. Pour une maintenance récurrente, vous pouvez supprimer une occurrence spécifique ou la série entière.

Conclusion

Les fenêtres de maintenance sont essentielles pour un monitoring sain. Elles éliminent le bruit prévisible, réduisent la fatigue d'alertes, et permettent à votre équipe de se concentrer sur les vrais incidents.

MoniTao vous donne tous les outils pour gérer vos maintenances : fenêtres ponctuelles ou récurrentes, application par tag, intégration API pour l'automatisation. Configurez votre première fenêtre et profitez de déploiements sereins.

Prêt à dormir sur vos deux oreilles ?

Commencez gratuitement, sans carte bancaire.