Le groupe Monitoring
Membres du groupe Monitoring
Contact: fr-regional-monitoring-admins-l@france-grilles.fr
- Administration de la Nagios Box Régionale :
- Carlos CARRANZA
- Nadia LAJILI
- Christine LEROY
- Emmanuel MEDERNACH
- Administration Système :
- Jacques GARNIER
- Dashboard :
- Cyril L'ORPHELIN
- ActiveMQ :
- Julien DEVEMY
- Opérations :
- Hélène CORDIER
- Pierre GIRARD
Départ de Christine LEROY
Tâches du groupe Monitoring
Description et répartition des tâches
- Coordonner les tâches liées à l'opération du système de monitoring régional
- Mise à jour des composants du service de monitoring national
- Suivi du projet (mailing liste monitoring EGI)
- Assurer une surveillance quotidienne du service (semaine d'astreintes)
- Intervenir sur le service en cas de probléme
- Documentation (Wiki, etc.)
Calcul de Disponibilité et Fiabilité
Une des missions du monitoring est de permettre la mesure de la disponibilité et de la fiabilité des sites.
Calculé par GRIDVIEW
Rapports mensuels de fiabilité / disponibilité :
Seuils (procédures de certification et de suspension)
Voir avec le groupe de certification pour plus de détailsProcédure de certification
Méthode de calcul
Un site est UP si les tests critiques sont Ok
Liste des sondes utilisés dans le calcul de la fiabilitéAvailability = time_site_is_available / total_time
Reliability = time_site_is_available / (total_time - time_site_is_scheduled_down)
Pour plus d'informations :
Remarques sur le calcul de disponibilité :
- OU logique entre disponibilité LCG-CE et CREAM
- La disponibilité d'un T2 doit être supérieure a 70% tous les mois
- La fiabilité d'un T2 doit être supérieure a 75%
- Source: Resource Center Operational Level Agreement