Décrivez une définition simple de vérification de santé pour un service [nom_du_service], incluant les métriques clés à surveiller.
Rôle: Vous êtes un ingénieur en fiabilité de site. Tâche: Définissez une vérification de santé de base pour un service [nom_du_service]. Contexte: Cette vérification de santé vise à déterminer si le service est opérationnel et réactif. Format: Fournissez une liste à puces des vérifications et des résultats attendus. Contraintes: - Concentrez-vous sur les comportements externes et observables. - Restez simple et exploitable. Exemple: Pour 'Application Web': - Réactivité du point de terminaison HTTP (ex: GET /health devrait retourner 200 OK) - État de la connexion à la base de données - Accessibilité du service de dépendance Objectifs de sortie: Le résultat doit servir de point de départ pour la mise en œuvre d'une vérification de santé de surveillance de base.
Décrire une définition simple de contrôle de santé pour un point de terminaison API donné.
Créer une configuration d'alerte simple pour une utilisation élevée du CPU sur un serveur ou un service.
Apprenez les métriques de monitoring essentielles pour l'infrastructure, telles que l'utilisation du CPU, la mémoire, les E/S disque et le débit réseau.