Réunion jointe Opération + AT Grille

Name: Réunion jointe Opération + AT Grille
Start: 2009-07-28T16:00:00+02:00
End: 2009-07-28T17:30:00+02:00
Location: IN2P3

mardi 28 juil. 2009, 16:00 → 17:30 Europe/Paris

322 (IN2P3)

322

IN2P3

Rolf Rumler (CNRS/IN2P3)

Description

Réunion en deux parties: 1. Opération site CCIN2P3 Participants: représentants de l'exploitation, du support et d'autres selon ordre du jour, plus ceux de la réunion AT Grille habituelle. 2. AT Grille Participants: ceux de la réunion AT Grille habituelle.

- 16:00 → 16:30
  
  Incidents et problèmes des VOs (CC, sites français, autres sites) 30m
  
  Sujets Exploitation+Stockage: ---------------------------------- - Nouveau pb avec release Atlas qui stress machine AFS - Xavier présente un nouveau système + nouvelles procédures pour stopper définitivement ce problème récurrent - Remise en prod de 6 racks de workers - Ouverture CE SL5. Mauvaise configuration grille sur les workers - doivent être retirés et réinstallés. - crash GPFS impliquant le drain des ressources GPFS - crash BD Oracle ??? (manque d'infos) - augmentation share T2analyse pour cmsf Sujets Support: ------------------- ALICE: ATLAS: http://cctools2.in2p3.fr/elog/support-atlas/78?hide=0 CMS: http://cctools2.in2p3.fr/elog/support-cms/79 LHCb: http://cctools2.in2p3.fr/elog/support-lhcb/31 Résumé: 1) Mauvais score tests d'analyse (lenteur 'data access') : - Point fait avec les dcache_masters : migration des données et allocation d'espace pour les space-tokens lhcb prévue d'ici un mois environ -> Profiter de cette occasion pour redistribuer les fichiers d'une façon plus homogène dans les pools. On fera des nouveaux tests d'ici un mois. et pour la semaine précédente : 1) A re-processing exercise has been done. It was concentrated on the ability to pre-stage the input data and to run re-processing jobs at the required rate -> At IN2P3 the target for the exercise was achieved : a) Nice prestage performances after the correction to an incident (raw data were cleaned not only from cache but even from hpss). b) Re-processing : all of the jobs reached terminal status within 2.5 days of the start of the exercise. The number of simulatenously running jobs peaked at over 1100 jobs at the beginning of day 2. The target of simulatenous running jobs was sustained for a 24 hour period while the system was saturated with jobs. Problèmes récurrents: ------------------------- Pour LHCb: http://cctools2.in2p3.fr/elog/problemes-VO/100 AT Grille généralement: ---------------------------- - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCache
  
  Orateur: Tous
- 16:30 → 16:35
  
  Charge et événements prévisibles pour la semaine à venir 5m
  
  Demandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérêt général. Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général.
  
  Orateur: Tous
- 16:35 → 16:40
  
  Nouvelles des équipes du CC 5m
  
  Sujets par équipe, avec un impact potentiel sur l'exploitation. Nouvelles des embauches
  
  Orateur: Un membre de chaque équipe
- 16:40 → 16:45
  
  break 5m
- 16:45 → 16:55
  
  Etat des projets Grille 10m
  
  - EGEE (Rolf) - EGI-DS (Rolf) - IdG (Rolf, Virginie, Yonny) - LCG (Pierre) - Grille régionale (Yonny) et projets en préparation, le cas échéant.
- 16:55 → 17:00
  
  Formation et dissémination 5m
  
  Formations et actions de dissémination passées, en cours, à prévoir.
  
  Orateur: Virginie, tous
- 17:00 → 17:05
  
  Nouvelles des coopérations 5m
  
  - Prague - CS / CILOE
- 17:05 → 17:10
  
  Affaires administratives 5m
  
  - Missions et absences dans la semaine à venir - Conférences / workshops annoncés Conférence "Transition EGI" les 14, 15 et 16 octobre à Lyon
- 17:10 → 17:15
  
  Divers 5m