Sujets Exploitation:
------------------------
- Changement matériel robotique: arrêt HPSS lundi/mardi, incident LSM mercredi.
- BQS détruit automatiquement des jobs lents LHCb, à investiguer (jeudi)
- Une non déclaration de la ressource HPSS fait que ce service est surchargé et
ne peut plus être régulé efficacement (week end)
- GPFS: risque de corruption des données (snls14), blocage d'accès (qcd).
- Stockage:
- 2 plantages du core server dcache LCG ce week-end.
- Erreurs du module d'authentification dû à un bug dans le script de détection/redémarrage
- Jobs FTS Atlas qui se terminent dans un état non final
Sujets Support:
-------------------
* LHCB:
- Comportement étrange des requêtes de pre-stage. Les fichiers sont bien sur disque (Lionel a vérifié), mais l'état des requêtes apparaît toujours 'pending'. Lionel est en train de regarder plus en détail, au même temps que les gens de LHCb du coté client.
* Divers:
- Documentation manquante pour Lagaffe concernant la declaration d'un downtime pour un service grille.
- Lagaffe toujours... La documentation "Procedure des retraits des services grille" (http://cctools2.in2p3.fr/docenligne/499) trouvee dans la base des connaissances est-elle toujours valide?
AT Grille généralement:
----------------------------
- CE, BDII, VOMS...
- SE, FTS, LFC, SRM, dCache