Réunion jointe Opération + AT Grille
→
Europe/Paris
322 (IN2P3)
322
IN2P3
Rolf Rumler
(CNRS/IN2P3)
Description
Réunion en deux parties:
1. Opération site CCIN2P3
Participants: représentants de l'exploitation, du support et d'autres selon ordre du jour,
plus ceux de la réunion AT Grille habituelle.
2. AT Grille
Participants: ceux de la réunion AT Grille habituelle.
-
-
1
Incidents et problèmes des VOs (CC, sites français, autres sites)Sujets Exploitation+Stockage: ---------------------------------- - suite a l'arrêt du 3/11 ~100 workers sont encore hors production. Micael va refaire un bilan. - changement de version de dCache lundi (1.9.5-6). ça s'est bien passé. Atlas a des problèmes de transfert en ce moment, mais ce n'est pas lié au changement de version (cf. Jonathan). - suppression des VOs alice, cmsf et lhcb des CE en SL4 lundi 9/11 - réinitialisation des SL8500 lundi 9/11 car nous avons des messages inquiétants (cellule qui n'existe plus dans la configuration du LMU). SUN France craint qu'on nous demande de changer de microcode du LMU car nous ne sommes pas au bon niveau suite aux blocage du mois d'avril. A ce sujet d'autres clients ont eu le problème, et SUN a mis en évidence que c'était une incompatibilité avec acsls. Le patch acsls est sorti pour la plateforme SUN (qui est utilisée au CERN) et est en cours de développement pour AIX. Nous devrons peut-etre faire cette intervention en fin d'année si les erreurs rencontrées la semaine dernière deviennent plus fréquentes. Ca va impliquer un arrêt ~3h. - Demande de devis à NGRI pour nettoyage de la salle robotique et des librairies SL8500 car SUN nous recommande de le faire. Nettoyage de la salle prévu fin novembre, des SL8500 fin décembre (date a déterminer avec le support LHC). - la plateforme SL5 (79% des cpus en SL5) commence a etre mieux utilisée. Passage en production mardi 17/11 (blocage BQS entre 9h30 et 12h). - beaucoup de jobs en queue pour cms100 - probleme conf CE? + probleme cote gestion de prod de cmsf T2. - 2 racks ont ete sortis de prod et rebootés pour mettre les patch sécurité. A continuer. Sujets Support: ------------------- _ATLAS_ Annonce par Atlas qu'on doit se considérer en prise de données et que tout arrêt pour intervention non OBLIGATOIRE (type patch de securté, blocage,....) doit être évitée. ******** Utilisation de la plateforme SL5 -Les softwares de Atlas ont été installés dans la zone SL5 de AFS. -Cela a permis d'ouvrir 2 CE SL5 vendredi. Les jobs de Atlas se sont exécutés parfaitement et depuis le WE, Atlas consomme plus de 40% des ressources de calcul. -Nous devrions cette semaine fermer les CEs SL4. ******** serveurs xrootd Nouveau serveur xrootd avec cache SSD pour tester les performances par les jobs d'Atlas: en cours.... ******** dCache Le golden release de dcache qui a été installé le 9 novembre ne permet pas de mettre les ACLs qui étaient requis par Atlas. Par exemple: on veut que certains repertoires soit en RW pour la production et seulement en R. En fait dès qu'on met les ACLs sur les repertoires/spacetokens, on ne peut plus ecrire de données dans ces répertoires. En conclusion, les ACLs ont été disablés le temps que les développeurs résolvent le problème. _ALICE _RAS _CMS _RAS _ LHCb _ Problème de data access par les jobs de stripping pdt le weekend (ticket GGUS : https://gus.fzk.de/ws/ticket_info.php?ticket=53261&from=search <https://gus.fzk.de/ws/ticket_info.php?ticket=53261&from=search>) -> Investigations en cours. Problèmes récurrents: ------------------------- *Exploitation* [Atlas, HPSS] : Script en attente de procédure d'utilisation pour le script listant le contenu de bandes bloquées (statut à confirmer par l'exploitation)(#110) Dernière nouvelles : HC a demandé en AT grille le 13/10 d'aborder le sujet en réunion HPSS/Expoitation. *Atlas* [Atlas, dcache] Demande de dump régulier pour comparer mensuellement avec les fichiers présents dans pnfs, #119 (y-a-t-il un update depuis le 13 Oct?) *Atlas* [Atlas, sysgrid] configuration/ installation de la VO box, #111 (abordé au dernier CAF Atlas octobre?) *Atlas* [Atlas, dcache] demande de script listant les fichiers présents dans dcache: http://cctools2.in2p3.fr/elog/problemes-VO/#108 merci de confirmer cette demande auprès des administrateurs dcache ou de me dire de fermer cette demande. *CMS* [CMS, HPSS] amélioration de pre-staging #114 (scénario à tester en Novembre) Stand-by : ======================================================================= *sysgrid* [CMS, sysgrid] Mapping sur pool de comptes #98 (low priority) *exploitation* [exploitation, robotique]#64 (micro-code) AT Grille généralement: ---------------------------- - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCacheOrateur: Tous
-
2
Charge et événements prévisibles pour la semaine à venirDemandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérêt général. Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général.Orateur: Tous
-
3
Nouvelles des équipes du CCSujets par équipe, avec un impact potentiel sur l'exploitation. Nouvelles des embauchesOrateur: Un membre de chaque équipe
-
16:40
break
-
4
Etat des projets Grille- EGEE (Rolf) - EGI-DS (Rolf) - EGI-Inspire - IdG (Rolf, Virginie, Yonny) - LCG (Pierre) - Grille régionale (Yonny) - GRIDOPS (Hélène) et projets en préparation, le cas échéant.
-
5
Formation et disséminationFormations et actions de dissémination passées, en cours, à prévoir.Orateur: Virginie, tous
-
6
Nouvelles des coopérations- Prague - CS / CILOE - EELA
-
7
Préparations transition ROC Fr --> NGI FrOrateur: Rolf
-
8
Affaires administratives- Missions et absences dans la semaine à venir - Conférences / workshops annoncés
-
9
Divers
-
1