Réunion jointe Opération + AT Grille
→
Europe/Paris
322 (IN2P3)
322
IN2P3
Rolf Rumler
(CNRS/IN2P3)
Description
Réunion en deux parties:
1. Opération site CCIN2P3
Participants: représentants de l'exploitation, du support et d'autres selon ordre du jour,
plus ceux de la réunion AT Grille habituelle.
2. AT Grille
Participants: ceux de la réunion AT Grille habituelle.
-
-
16:00
→
16:30
Incidents et problèmes des VOs (CC, sites français, autres sites) 30mSujets Exploitation+Stockage: ---------------------------------- - pas de machines pistoo en production. Il faut penser à les donner à Julien pour qu'il leur mette la bonne version de bqs avant de les mettre en prod. - manque beaucoup de workers côté anastasie. Le premier rack de blade Dell sera prêt lundi. Bien vérifier que les jobs qui passent sur les machines ont un temps cpu normalisé comparable aux jobs passés sur d'autres machines. Donc ne mettre en prod que quelques machines au début, pas tout le rack. - côté production : atlas et cmsf semblent attendre le retour de dCache avec Chimera pour lancer des jobs-> donc pas de production urgente ce weekend. - Je met un job qui drainera les ressources dcache-LHC dimanche soir 23h. Divers : - la benne pour les volumes 9940 à recycler partira mardi -> mettre les volumes 9940 HPSS de la librairie CI lundi dans la journée. - présentation SGE le 30/09. Si plusieurs personnes du groupes peuvent y aller ce serait bien pour avoir plusieurs vues. - penser à envoyer un mail à WLCG-operation pour dire quand nous aurons récupéré toutes nos machines, et au redémarrage de dCache le 1/10. Sujets Support: ------------------- ATLAS : **** reprocessing: Le reprocessing de Atlas qui était attendu depuis la mi-Aout a finalement été prêt à être fait le vendredi 25 septembre dans l'après midi. A cause de la longueur des jobs et de l'arrêt suivant de dcache pour migrer vers Chimera, il a été décidé de ne pas envoyer de jobs sur notre site. ***** dcache pools 1 pool de dcache contenant des données de ATLAS n'a pas pu être mis ON. Il s'agit d'environ 200K de fichiers de Atlas. Des jobs de Atlas ont échoué parce qu'ils demandaient des AOD qui s'y trouvent. **** installation sur AFS Les installations de nouveaux releases de Atlas a échoué à cause d'un "AFS lock" qui était encore sur les volumes p CMS : SAM test ######## - The path of the dcap libs was changed after dcap client being upgraded to dcap-1.9.3-0 (srmclient-1.9.2-4). - Lionel notified us on 25th September afternoon, I implemented the new path in the Phedex local config files agents on 26th September at 18h. - The change was not committed to CVS which caused the failure of the CE-cms-analysis SAM test all the weekend. - Due to the scheduled migration to chimera on 28th September it was decided to drain the jobs requesting dcache resources on 27th at 23h. - So even if I committed to CVS and synchronized our local and CVS config files on 28th at 9h, the SAM test follow failing since no job has lend to the WNs since Sunday evening. - I wonder if/how we can avoid this next time!!, namely leave the door open to SAM test until the downtime start? ALICE : activité presque zéro du fait du downtime, et peu de jobs de production en queue depuis. depuis vendredi ont commencé des problèmes avec la vobox cclcgalice02 qui était complètement surchargée. ceci a provoqué des temps de latence importants pour les jobs arrivant (venant majoritairement des utilisateurs) le problème pourrait être lié au soft ALICE, un diagnostic est en cours. LHCb : Dirac dispose d'une nouvelle fonctionnalité qui permet d'envoyer des jobs qui n'utilise pas SRM si SRM est en downtime sur un site. Les ressources u_dcache_lhcb et u_dcache_lhcbT2 ont donc été réouverte pendant le downtime dCache pour tester la validité de cette fonctionnalité. Problèmes récurrents: ------------------------- AT Grille généralement: ---------------------------- - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCacheOrateur: Tous
-
16:30
→
16:35
Charge et événements prévisibles pour la semaine à venir 5mDemandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérêt général. Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général.Orateur: Tous
-
16:35
→
16:40
Nouvelles des équipes du CC 5mSujets par équipe, avec un impact potentiel sur l'exploitation. Nouvelles des embauchesOrateur: Un membre de chaque équipe
-
16:40
→
16:45
break 5m
-
16:45
→
16:55
Etat des projets Grille 10m- EGEE (Rolf) - EGI-DS (Rolf) - IdG (Rolf, Virginie, Yonny) - LCG (Pierre) - Grille régionale (Yonny) et projets en préparation, le cas échéant.
-
16:55
→
17:00
Formation et dissémination 5mFormations et actions de dissémination passées, en cours, à prévoir.Orateur: Virginie, tous
-
17:00
→
17:05
Nouvelles des coopérations 5m- Prague - CS / CILOE - EELA
-
17:05
→
17:20
Préparations transition ROC Fr --> NGI Fr 15mOrateur: Rolf
-
17:20
→
17:25
Affaires administratives 5m- Missions et absences dans la semaine à venir - Conférences / workshops annoncés Conférence "Transition EGI" les 14, 15 et 16 octobre à Lyon
-
17:25
→
17:30
Divers 5m
-
16:00
→
16:30