Réunion jointe Opération + AT Grille

Europe/Paris
322 (IN2P3)

322

IN2P3

Rolf Rumler (CNRS/IN2P3)
Description
Réunion en deux parties: 1. Opération site CCIN2P3 Participants: représentants de l'exploitation, du support et d'autres selon ordre du jour, plus ceux de la réunion AT Grille habituelle. 2. AT Grille Participants: ceux de la réunion AT Grille habituelle.
Minutes
    • 1
      Incidents et problèmes des VOs (CC, sites français, autres sites)
      Sujets Exploitation+Stockage: ---------------------------------- - Nouveau pb avec release Atlas qui stress machine AFS - Xavier présente un nouveau système + nouvelles procédures pour stopper définitivement ce problème récurrent - Remise en prod de 6 racks de workers - Ouverture CE SL5. Mauvaise configuration grille sur les workers - doivent être retirés et réinstallés. - crash GPFS impliquant le drain des ressources GPFS - crash BD Oracle ??? (manque d'infos) - augmentation share T2analyse pour cmsf Sujets Support: ------------------- ALICE: ATLAS: http://cctools2.in2p3.fr/elog/support-atlas/78?hide=0 CMS: http://cctools2.in2p3.fr/elog/support-cms/79 LHCb: http://cctools2.in2p3.fr/elog/support-lhcb/31 Résumé: 1) Mauvais score tests d'analyse (lenteur 'data access') : - Point fait avec les dcache_masters : migration des données et allocation d'espace pour les space-tokens lhcb prévue d'ici un mois environ -> Profiter de cette occasion pour redistribuer les fichiers d'une façon plus homogène dans les pools. On fera des nouveaux tests d'ici un mois. et pour la semaine précédente : 1) A re-processing exercise has been done. It was concentrated on the ability to pre-stage the input data and to run re-processing jobs at the required rate -> At IN2P3 the target for the exercise was achieved : a) Nice prestage performances after the correction to an incident (raw data were cleaned not only from cache but even from hpss). b) Re-processing : all of the jobs reached terminal status within 2.5 days of the start of the exercise. The number of simulatenously running jobs peaked at over 1100 jobs at the beginning of day 2. The target of simulatenous running jobs was sustained for a 24 hour period while the system was saturated with jobs. Problèmes récurrents: ------------------------- Pour LHCb: http://cctools2.in2p3.fr/elog/problemes-VO/100 AT Grille généralement: ---------------------------- - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCache
      Orateur: Tous
    • 2
      Charge et événements prévisibles pour la semaine à venir
      Demandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérêt général. Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général.
      Orateur: Tous
    • 3
      Nouvelles des équipes du CC
      Sujets par équipe, avec un impact potentiel sur l'exploitation. Nouvelles des embauches
      Orateur: Un membre de chaque équipe
    • 16:40
      break
    • 4
      Etat des projets Grille
      - EGEE (Rolf) - EGI-DS (Rolf) - IdG (Rolf, Virginie, Yonny) - LCG (Pierre) - Grille régionale (Yonny) et projets en préparation, le cas échéant.
    • 5
      Formation et dissémination
      Formations et actions de dissémination passées, en cours, à prévoir.
      Orateur: Virginie, tous
    • 6
      Nouvelles des coopérations
      - Prague - CS / CILOE
    • 7
      Affaires administratives
      - Missions et absences dans la semaine à venir - Conférences / workshops annoncés Conférence "Transition EGI" les 14, 15 et 16 octobre à Lyon
    • 8
      Divers