Réunion jointe Opération + AT Grille
mardi 29 septembre 2009 -
16:00
lundi 28 septembre 2009
mardi 29 septembre 2009
16:00
Incidents et problèmes des VOs (CC, sites français, autres sites)
-
Tous
Incidents et problèmes des VOs (CC, sites français, autres sites)
Tous
16:00 - 16:30
Room: 322
Sujets Exploitation+Stockage: ---------------------------------- - pas de machines pistoo en production. Il faut penser à les donner à Julien pour qu'il leur mette la bonne version de bqs avant de les mettre en prod. - manque beaucoup de workers côté anastasie. Le premier rack de blade Dell sera prêt lundi. Bien vérifier que les jobs qui passent sur les machines ont un temps cpu normalisé comparable aux jobs passés sur d'autres machines. Donc ne mettre en prod que quelques machines au début, pas tout le rack. - côté production : atlas et cmsf semblent attendre le retour de dCache avec Chimera pour lancer des jobs-> donc pas de production urgente ce weekend. - Je met un job qui drainera les ressources dcache-LHC dimanche soir 23h. Divers : - la benne pour les volumes 9940 à recycler partira mardi -> mettre les volumes 9940 HPSS de la librairie CI lundi dans la journée. - présentation SGE le 30/09. Si plusieurs personnes du groupes peuvent y aller ce serait bien pour avoir plusieurs vues. - penser à envoyer un mail à WLCG-operation pour dire quand nous aurons récupéré toutes nos machines, et au redémarrage de dCache le 1/10. Sujets Support: ------------------- ATLAS : **** reprocessing: Le reprocessing de Atlas qui était attendu depuis la mi-Aout a finalement été prêt à être fait le vendredi 25 septembre dans l'après midi. A cause de la longueur des jobs et de l'arrêt suivant de dcache pour migrer vers Chimera, il a été décidé de ne pas envoyer de jobs sur notre site. ***** dcache pools 1 pool de dcache contenant des données de ATLAS n'a pas pu être mis ON. Il s'agit d'environ 200K de fichiers de Atlas. Des jobs de Atlas ont échoué parce qu'ils demandaient des AOD qui s'y trouvent. **** installation sur AFS Les installations de nouveaux releases de Atlas a échoué à cause d'un "AFS lock" qui était encore sur les volumes p CMS : SAM test ######## - The path of the dcap libs was changed after dcap client being upgraded to dcap-1.9.3-0 (srmclient-1.9.2-4). - Lionel notified us on 25th September afternoon, I implemented the new path in the Phedex local config files agents on 26th September at 18h. - The change was not committed to CVS which caused the failure of the CE-cms-analysis SAM test all the weekend. - Due to the scheduled migration to chimera on 28th September it was decided to drain the jobs requesting dcache resources on 27th at 23h. - So even if I committed to CVS and synchronized our local and CVS config files on 28th at 9h, the SAM test follow failing since no job has lend to the WNs since Sunday evening. - I wonder if/how we can avoid this next time!!, namely leave the door open to SAM test until the downtime start? ALICE : activité presque zéro du fait du downtime, et peu de jobs de production en queue depuis. depuis vendredi ont commencé des problèmes avec la vobox cclcgalice02 qui était complètement surchargée. ceci a provoqué des temps de latence importants pour les jobs arrivant (venant majoritairement des utilisateurs) le problème pourrait être lié au soft ALICE, un diagnostic est en cours. LHCb : Dirac dispose d'une nouvelle fonctionnalité qui permet d'envoyer des jobs qui n'utilise pas SRM si SRM est en downtime sur un site. Les ressources u_dcache_lhcb et u_dcache_lhcbT2 ont donc été réouverte pendant le downtime dCache pour tester la validité de cette fonctionnalité. Problèmes récurrents: ------------------------- AT Grille généralement: ---------------------------- - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCache
16:30
Charge et événements prévisibles pour la semaine à venir
-
Tous
Charge et événements prévisibles pour la semaine à venir
Tous
16:30 - 16:35
Room: 322
Demandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérêt général. Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général.
16:35
Nouvelles des équipes du CC
-
Un membre de chaque équipe
Nouvelles des équipes du CC
Un membre de chaque équipe
16:35 - 16:40
Room: 322
Sujets par équipe, avec un impact potentiel sur l'exploitation. Nouvelles des embauches
16:40
break
break
16:40 - 16:45
Room: 322
16:45
Etat des projets Grille
Etat des projets Grille
16:45 - 16:55
Room: 322
- EGEE (Rolf) - EGI-DS (Rolf) - IdG (Rolf, Virginie, Yonny) - LCG (Pierre) - Grille régionale (Yonny) et projets en préparation, le cas échéant.
16:55
Formation et dissémination
-
Virginie, tous
Formation et dissémination
Virginie, tous
16:55 - 17:00
Room: 322
Formations et actions de dissémination passées, en cours, à prévoir.
17:00
Nouvelles des coopérations
Nouvelles des coopérations
17:00 - 17:05
Room: 322
- Prague - CS / CILOE - EELA
17:05
Préparations transition ROC Fr --> NGI Fr
-
Rolf
Préparations transition ROC Fr --> NGI Fr
Rolf
17:05 - 17:20
Room: 322
17:20
Affaires administratives
Affaires administratives
17:20 - 17:25
Room: 322
- Missions et absences dans la semaine à venir - Conférences / workshops annoncés Conférence "Transition EGI" les 14, 15 et 16 octobre à Lyon
17:25
Divers
Divers
17:25 - 17:30
Room: 322