Reunion joint Operation +AT grille (Hélène)

Europe/Paris
322

322

Rolf Rumler (CNRS/IN2P3), helene Cordier (CNRS/IN2P3)
Description
Réunion en 2 parties : 1- Operation site CCIN2P3 Participants : représentants de l'exploitation, du support et d'autres selon l'ordre du jour plus ceux de la réunion AT grille habituelle. 2-AT Grille Participants: ceux de la réunion AT Grille habituelle - 21 Octobre : Yonny excusé - congés.
    • 16:00 16:25
      Incidents et problèmes des VOs ( CC- sites français, autres sites) 25m
      Sujets exploitation - Marc Hausard: -Arrêt 15 Octobre -Pb tests SAM 11 et 12 oct sur lcgce01 et lcgce02 -Soumission massive atlas === Sujets Support Yvan Calas: Atlas: - Tests de prestaging repris lundi après midi en collaboration avec les experts dcache et HPSS. On constate un débit faible de staging (~.5 To/heure ). Pour notre capacité CPU, il faudrait environ 1.5 To/Heure. Problème actuellement en cours d'étude. - Beaucoup de jobs pilotes qui ne consommaient pas de CPU. Cela etait du au fait que Atlas n'avait plus de jobs de production à faire tourner sur notre site. Projet d'adaptation automatique du nombre de jobs pilotes aux nombre de jobs réels envoyés sur notre site pour éviter de surcharger BQS. CMS: T1's CE ********* - Pierre has performed some modification on both cclcgceli03 and cclcgceli04 to avoid the access of Normal jobs to T1 queues. - Due to this modification the T1_FR_CCIN2P3 was not visible in BDII. since Thursday until Monday 21th October at 16.h. - CMS use the LCG Savanna to address this kind of issue. A fix was provided by Pierre on Sunday, but its propagated was required many time to get to the person, who was submitted the ticket (Ticket was closed on Monday 16:00h). - I have reported in the CMS Facility Operation meeting the needs of using the GGUS for this kind of trouble.The fact that CCIN2P3 has already implemented an interface to GGUS will allow the side admins to be quickly notified about the ticket, and then the people can be get updated regarding any progress in the ticket in question in a reasonable time scale. Tape Families *********** - CCIN2P3 is the only CMS T1 that has not implemented yet the Tap families. I have already talked to Lionel in several times. But I think we need to have an agreement between the master of the Storage System (dCache + HPSS) and us on the best way to implement that accommodating the CMS proposal and respecting the limitation that could has our Storage System. AT Grille généralement - Pierre Girard: -CE, BDII, VOMS, ... -SE, FTS, LFC, SRM, DCache - Mise en place d'une nouvelle version des WN (3.1.19) accessible depuis tous les CEs T1/T2 - Installation et livraison de 3 VO Boxes * cclcgcms03 pour CMS * cclcgatlas03 pour ATLAS * cclcgsamap01 pour la SAM Admin page (Rafal) - Mise à jour des UIs, utilisée uniquement par les nouvelles VO Boxes pour l'instant - A la demande des sysadmins: * Jeu des chaises musicales sur les CEs pour upgrade du firmware (tous les CEs ont été sorti de production par lot de 3) * sortie d'un CE (cclcgceli03) de production depuis vendredi pour autopsie par les experts IBM (qui ne sont pas encore venus). Attention: il n'y a plus de rédondance sur certaines VOs pour le T1. Si le CE cclcgceli04 tombe, il faut intervention rapide d'un sysadmin pour le redémarrer. A faire (par ordre de priorité): - mise en prod sur les ccali de la nouvelle version des UIs - modification des logname (pas de planning) - mise-à-jour des CEs (pas de planning) - implémenter les share sur le jobmanager et l'information provide des CE Pour finir, pas de gridmaster officiel la semaine prochaine jusqu'à jeudi.
    • 16:25 16:35
      Charge et évènements prévisibles pour la semaine à venit 10m
      Demandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérête général. Aussi des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général.
    • 16:35 16:40
      Nouvelles des équipes du CC 5m
      Sujets par équipe, avec un impact potentiel sur l'exploitation
    • 16:40 16:50
      break 10m
    • 16:50 17:00
      Etat des projets Grille 10m
      - EGEE ( Pierre) - EGI-DS (Hélène) - IdG ( Virginie) - LCG (Pierre) - IGTMD (Hélène) - Grille Régionale ((Pierre, Yonny) et projets en préparation le cas échéant.
    • 17:00 17:05
      Nouvelle des coopérations 5m
      - FJ/KPPL (Yonny) - Voyage Japon/ Corée (David, Yonny)
    • 17:05 17:10
      Affaires administratives 5m
      - Missions et absences dans la semaine à venir - Vacances de fin d'année et continuité du service
    • 17:10 17:20
      Divers 10m