Réunion jointe Opération + AT Grille
mardi 16 mars 2010 -
16:00
lundi 15 mars 2010
mardi 16 mars 2010
16:00
Etat des projets Grille
Etat des projets Grille
16:00 - 16:10
Room: 322
- EGI-Inspire - IdG (Rolf, Virginie, Yonny) - LCG (Jacques) - Grille régionale (Yonny) et projets en préparation, le cas échéant.
16:10
Nouvelles des coopérations
Nouvelles des coopérations
16:10 - 16:15
Room: 322
- Prague - EELA/GISELA - Asie (FJPPL/KEK, FKPPL/KISTI)
16:15
Formation et dissémination
-
Virginie, tous
Formation et dissémination
Virginie, tous
16:15 - 16:20
Room: 322
Formations et actions de dissémination passées, en cours, à prévoir.
16:20
Préparations transition ROC Fr --> NGI Fr
-
Rolf
Préparations transition ROC Fr --> NGI Fr
Rolf
16:20 - 16:35
Room: 322
- Site web France Grilles (Virginie) - Plan d'organisation des Opérations (Rolf)
16:35
Affaires administratives
Affaires administratives
16:35 - 16:40
Room: 322
- Missions et absences dans la semaine à venir - Conférences / workshops annoncés
16:40
break
break
16:40 - 16:45
Room: 322
16:45
Incidents et problèmes des VOs (CC, sites français, autres sites)
-
Tous
Incidents et problèmes des VOs (CC, sites français, autres sites)
Tous
16:45 - 17:15
Room: 322
Sujets Exploitation+Stockage: ---------------------------------- Mercredi : - lenteurs d'accès aux bases Oracle (charge du à antares). - beaucoup de jobs lents pour cms050. jeudi : - réduction de la ressource u_dcache_cmsf car trop de jobs lents (en attente de fichiers dans hpss). La situation redevient normale dans l'après-midi mais aucune information du support sur la cause réelle. - cctsli02 (SL5) mise en production. cctsli01 mise disable. Attendre le retour d'espigat sur lecture LTO avant de faire passer cctsli01 en SL5. Vendredi : alerte Nagios pour cclcgip03 check_site_publication : il manque 3 DN, ceux de ccsrmt2. Du à un changement de script par Lionel? retour ancienne version. Sujets Support: ------------------- ATLAS *Tests de transferts avec le setup de test mis en place par David pour FTS2.2.3: pour l'instant les transferts plantent bien que le serveur fonctionne correctement. En cours. * La vobox cclcgatlas03 a été livrée à Atlas après installation par les sysunix, grille et support atlas des couches inférieures. Le proxy renewal marche. Panda (l'exécuteur) n'est pas encore entièrement fonctionnel. Dès que cette vobox fonctionnera correctement, la vieille vobox cclcgatlas02 sera déclarée obsolète. Atlas aura enfon à disposition 2 voboes à jour, cclcgatlas03 et 04 qui assureront la redondance du service. * Les tests du nouveau Frontier sont en cours. Les premiers résultats semblent très prometteurs pour l'amélioration des accès aux bases de données depuis des sites lointains (Beijong, Tokyo) * toujours autant de processing Atlas. il s'agit de Monte-Carlo et pas des reprocessing des données tel qu'il a été fait en fevrier. Ce type de tâche tourne en permanence dans les Tier1, sans information spécifique sur son envoi. CMS * JobRobot: ok * SAM: On 19th march SAM test failed due to SRM that was down. The issue was identified and fixed o Reprocessing: *************** o On 8th march many slow jobs were seen. There were > 1200 jobs that run over 7 files. This caused the slowness of the jobs to get their input. o On 11th March many slow jobs seen again. This time the issue was at the dcache level where the stage-out agent was deactivated. The issue was identified in Thursday morning and fixed quickly. o Phedex: ******* - release 3.3.0 was installed and all the instances are running with it - Nicolo has submitted some requests on 1500 files to check the blockverify agent. Everything went fine o FTS: ******* - release 2.2.3 was installed, the tests were success. SCHEDULED Downtime on 18th march for upgrading to FTS 2.2.3. ALICE: RAS LHCb: RAS Problèmes récurrents: ------------------------- AT Grille généralement: ---------------------------- - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCache
17:15
Charge et événements prévisibles pour la semaine à venir
-
Tous
Charge et événements prévisibles pour la semaine à venir
Tous
17:15 - 17:20
Room: 322
Demandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérêt général. Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général. - RAPPEL: chaque intervention même à priori anodine qui pourrait avoir un impact sur la production nécessite un accord du comité de direction à partir du 4/12/2009
17:20
Nouvelles des équipes du CC
-
Un membre de chaque équipe
Nouvelles des équipes du CC
Un membre de chaque équipe
17:20 - 17:25
Room: 322
Sujets par équipe, avec un impact potentiel sur l'exploitation. Nouvelles des embauches
17:25
Divers
Divers
17:25 - 17:30
Room: 322