Réunion jointe Opération + AT Grille
mardi 27 avril 2010 -
16:00
lundi 26 avril 2010
mardi 27 avril 2010
16:00
Etat des projets Grille
Etat des projets Grille
16:00 - 16:10
Room: 322
- EGEE (Hélène) - EGI-Inspire - IdG (Rolf, Virginie, Yonny) - LCG (Pierre) - Grille régionale (Yonny) et projets en préparation, le cas échéant.
16:10
Nouvelles des coopérations
Nouvelles des coopérations
16:10 - 16:15
Room: 322
- EELA/GISELA - Asie (FCPPL, FJPPL/KEK, FKPPL/KISTI)
16:15
Formation et dissémination
-
Virginie, tous
Formation et dissémination
Virginie, tous
16:15 - 16:20
Room: 322
Formations et actions de dissémination passées, en cours, à prévoir.
16:20
Préparations transition ROC Fr --> NGI Fr
-
Rolf
Préparations transition ROC Fr --> NGI Fr
Rolf
16:20 - 16:35
Room: 322
- Site web France Grilles (Virginie) - Plan d'organisation des Opérations (Rolf)
16:35
Affaires administratives
Affaires administratives
16:35 - 16:40
Room: 322
- Missions et absences dans la semaine à venir - Conférences / workshops annoncés
16:40
break
break
16:40 - 16:45
Room: 322
16:45
Incidents et problèmes des VOs (CC, sites français, autres sites)
-
Tous
Incidents et problèmes des VOs (CC, sites français, autres sites)
Tous
16:45 - 17:15
Room: 322
Sujets Exploitation+Stockage: ---------------------------------- Sujets Support: ------------------- _ATLAS :_ ***** Quelques problèmes de transferts vers le CC 15 Avril Le probème était dû au serveur SRM qui a du être redémarré. ***** Toujours des problèmes de finalisation des installations AFS. -demande ou action de synchronisation des tags sur les CEs - AFS et ATLAS support ont développé des crons et des scripts pour identifier les releases de software manquants ainsi que les volumes de AFS qui sont corrompus. - Pierre Girard test un montage NFS pour que le fichiers des tags sur les CEs soit commun à tous les CEs (évite l'envoi d'un job d'installation de release par CE) ***** Débût du reprocessing des données réelles de ATLAS le vendredi 22 Avril. Le reprocessing se déroule bien. Les incidents à relever: les 2 arrêts, l'un de Oracle le samedi soir et l'autre de AFS lundi. Atlas n'a pas arrêté son reprocessing à l'annonce du downtime AFS lundi soir. Pas d'erreur liees a ca et reprocessing effectue a ~98% a midi mardi. _CMS :_ * SAM tests : Quelques petites faiblesses SRM qui ont entrainés des SAMs en défaut. - Plantage la nuit du 24 au 25 : - Problemes sur la base de données oracle BQS ont forcé un downtime non programmé. Du coup, impact sur les services CEs FTS ... down => SAM en défaut. * jobs : OK * Autre : Ce jour 27 : Jobs de reprocessing qui ne consomment quasiment pas de CPU dans la matinée. Probablement relié à la panne AFS d'hier _LHCb :_ RAS _Alice :_ RAS Problèmes récurrents: ------------------------- AT Grille généralement: ---------------------------- - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCache
17:15
Charge et événements prévisibles pour la semaine à venir
-
Tous
Charge et événements prévisibles pour la semaine à venir
Tous
17:15 - 17:20
Room: 322
Demandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérêt général. Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général. - RAPPEL: chaque intervention même à priori anodine qui pourrait avoir un impact sur la production nécessite un accord du comité de direction à partir du 4/12/2009
17:20
Nouvelles des équipes du CC
-
Un membre de chaque équipe
Nouvelles des équipes du CC
Un membre de chaque équipe
17:20 - 17:25
Room: 322
Sujets par équipe, avec un impact potentiel sur l'exploitation. Nouvelles des embauches
17:25
Divers
Divers
17:25 - 17:30
Room: 322