Réunion jointe Opération + AT Grille

Europe/Paris
322 (IN2P3)

322

IN2P3

Rolf Rumler (CNRS/IN2P3)
Description
Réunion en deux parties: 1. Opération site CCIN2P3 Participants: représentants de l'exploitation, du support et d'autres selon ordre du jour, plus ceux de la réunion AT Grille habituelle.
Réunion jointe Opération + AT Grille (11 Aug 2009) Chaired by: Mr. Hélène Cordier ================== Incidents et problèmes des VOs (CC, sites français, autres sites) ================== Pour le 25 août : Faire un point sur le pb d'Alice du 11 août - ATLAS rien de particulier - ALICE pbs de renouvellement de proxy (effectué à chaque soumission de job pour ALice) : Recommendations à RV : débugger sur le 2ème VO box Alice avec les infos de JMBarbet. Attention : La 2ème VO BOx doit être enregistrée quelquepart (RV doit contacter P.Mendez). Pour une production particulière est-ce en relation avec le pb de L.Betev ( GGUS) lié à un pb de release sur afs. Globalement : Manque de precision (on ne sait pas si c'est lié au CC ou pas). -LHCB en cours de migration de thumper vers thor et tri de vieux fichiers. Mise en place du "Filling mode" ce qui implique une récupération des informations particulières et lhcb doit modifier leur convention. - CMS no report - les pbs recurrents: -[Atlas] Installation Athena #101 (incluant la surcharge du serveur afs #65) en cours -[Atlas, dcache] Comparaison mensuelle des fichiers Atlas (dcache vs. pnfs)#102 -[Atlas, HPSS] Demande d'avoir une liste des fichiers des bandes bloquées non récupérables #103 -[Lhcb] data access tests via dcache #100 en cours --> stand-by en septembre ================== Charge et événements prévisibles pour la semaine à venir ================== - Reprocessing à partir des ESD (fichiers sur disque): ce reprocessing a été retardé au 24 Aout car les softwares Atlas à utiliser ne sont pasencore prêts. ================== Nouvelles des équipes du CC ================== - Adminsys : Jacques Garnier nouvel admin sys dédié grille arrivée, suivra la formation administrateur grille le 2 septembre, arrivée le 31 août. - Support : Jusqu'aù 31 août, pas de support CMS, jusqu'aù retour de Farida. - Developpement : Marcos Lins définitivement parti au 05 août 2009.
Il y a un compte-rendu associé à cet événement. Les afficher.
    • 16:00 16:30
      Incidents et problèmes des VOs (CC, sites français, autres sites) 30m
      Sujets Exploitation+Stockage: ---------------------------------- Réduction de puissance à 50 % depuis le 05 août jusqu'à la fin de l'intervention Thrane en fin de semaine. Remontée de puissance à prévoir pour le 17 août. Instabilités de HPSS, RFIO accrues depuis le week-end dernier . Sujets Support: ------------------- Voici le rapport pour le support : ATLAS - Test de prestaging pour Atlas avec treqs: Le test a commencé le 6 Aout après vérifiction que toute la liste des fichiers utilisés était bien disponible au CC mais étaient effacés des disques (pour s'assurer qu'il y a vraiment montage des bandes). Analyse en cours des performances. Le test a permis de montrer qu'il faut modifier par exemple la limite du nombre de requêtes qu'un pool peut envoyer à treqs. Quand le nombre de requête est plus grand que la limite de la queue, toutes les requêtes ne sont pas envoyées en même temps, donc les requêtes envoyées après peuvent demander des montages de bandes supplémentaires. - Reprocessing à partir des ESD (fichiers sur disque): ce reprocessing a été retardé au 24 Aout car les softwares Atlas à utiliser ne sont pas encore prêts. -Tests xrootd; Tests de running de jobs Atlas sur deux serveurs xrootd avec des configurations ZFS différentes. Ces tests montrent un gain d'environ 30% sur le serveur avec la nouvelle configuration optimisée par Xavier et Loïc. En cours ALICE nouvelle production pp et PbPb, beaucoup de jobs soumis mais quasiment aucun avec succes. un probleme de renouvellement de proxy a ete note, les experts d'alice sont dessus. LHCb 1) Après discussion avec lhcb et Steve Traylan, lhcb va changer sa façon de récupérer les infos du BDII pour activer le 'filling mode', car notre façon de publier est celle recommandée. 2) Tri de vieux fichiers (~ 383000) en cours. Attente de validation de lhcb pour faire le nettoyage. Problèmes récurrents des VO : ATLAS - HPSS Demande de pouvoir avoir automatiquement, via un script hpss une liste des fichiers contenus sur des bandes blocquées non récupérables. ATLAS - dCache Il est question de faire un dump de la DB dcache pour comparer avec les fichiers présents dans pnfs tous les mois pour Atlas - en attendant un upgrade de Chimera. Pour pouvoir purger les incohérences entre présence physique et catalogue qui se sont produit déjà 3 fois depuis mi-juin. Problèmes récurrents: ------------------------- AT Grille généralement: ---------------------------- - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCache
      Orateur: Tous
      Le 25 août : Faire un point sur le pb d'Alice du 11 août - ATLAS rien de particulier - ALICE pbs de renouvellement de proxy (effectué à chaque soumission de job pour ALice) : Recommendations à RV : débugger sur le 2ème VO box Alice avec les infos de JMBarbet. Attention : La 2ème VO BOx doit être enregistrée quelquepart (RV doit contacter P.Mendez). Pour une production particulière est-ce en relation avec le pb de L.Betev ( GGUS) lié à un pb de release sur afs. Globalement : Manque de precision (on ne sait pas si c'est lié au CC ou pas). -LHCB en cours de migration de thumper vers thor et tri de vieux fichiers. Mise en place du "Filling mode" ce qui implique une récupération des informations particulières et lhcb doit modifier leur convention. - CMS no report - les pbs recurrents: -[Atlas] Installation Athena #101 (incluant la surcharge du serveur afs #65) en cours -[Atlas, dcache] Comparaison mensuelle des fichiers Atlas (dcache vs. pnfs)#102 -[Atlas, HPSS] Demande d'avoir une liste des fichiers des bandes bloquées non récupérables #103
    • 16:30 16:35
      Charge et événements prévisibles pour la semaine à venir 5m
      Demandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérêt général. Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général.
      Orateur: Tous
      - Reprocessing à partir des ESD (fichiers sur disque): ce reprocessing a été retardé au 24 Aout car les softwares Atlas à utiliser ne sont pasencore prêts.
    • 16:35 16:40
      Nouvelles des équipes du CC 5m
      Sujets par équipe, avec un impact potentiel sur l'exploitation. Nouvelles des embauches
      Orateur: Un membre de chaque équipe
      - Adminsys : Jacques Garnier nouvel admin sys dédié grille arrivée, suivra la formation administrateur grille le 2 septembre, arrivée le 31 août. - Support : Jusqu'aù 31 août, pas de support CMS, jusqu'aù retour de Farida. - Developpement : Marcos Lins définitivement parti au 05 août 2009.
    • 16:40 16:45
      break 5m
    • 16:45 16:55
      Etat des projets Grille 10m
      - EGEE (Rolf) - EGI-DS (Rolf) - IdG (Rolf, Virginie, Yonny) - LCG (Pierre) - Grille régionale (Yonny) et projets en préparation, le cas échéant.
    • 16:55 17:00
      Formation et dissémination 5m
      Formations et actions de dissémination passées, en cours, à prévoir.
      Orateur: Virginie, tous
    • 17:00 17:05
      Nouvelles des coopérations 5m
      - Prague - CS / CILOE
    • 17:05 17:10
      Affaires administratives 5m
      - Missions et absences dans la semaine à venir - Conférences / workshops annoncés Conférence "Transition EGI" les 14, 15 et 16 octobre à Lyon
    • 17:10 17:15
      Divers 5m