Sujets Exploitation+Stockage:
----------------------------------
- Nouveau pb avec release Atlas qui stress machine AFS - Xavier présente
un nouveau système + nouvelles procédures pour stopper définitivement
ce problème récurrent
- Remise en prod de 6 racks de workers
- Ouverture CE SL5. Mauvaise configuration grille sur les workers -
doivent être retirés et réinstallés.
- crash GPFS impliquant le drain des ressources GPFS
- crash BD Oracle ??? (manque d'infos)
- augmentation share T2analyse pour cmsf
Sujets Support:
-------------------
ALICE:
ATLAS:
http://cctools2.in2p3.fr/elog/support-atlas/78?hide=0
CMS:
http://cctools2.in2p3.fr/elog/support-cms/79
LHCb:
http://cctools2.in2p3.fr/elog/support-lhcb/31
Résumé: 1) Mauvais score tests d'analyse (lenteur 'data access') :
- Point fait avec les dcache_masters :
migration des données et allocation d'espace pour les space-tokens lhcb prévue d'ici un mois environ -> Profiter
de cette occasion pour redistribuer les fichiers d'une façon plus homogène dans les pools. On fera des nouveaux tests d'ici un mois.
et pour la semaine précédente :
1) A re-processing exercise has been done. It was concentrated on the ability to pre-stage the input data and to
run re-processing jobs at the required rate -> At IN2P3 the target for the exercise was achieved :
a) Nice prestage performances after the correction to an incident (raw data were cleaned not
only from cache but even from hpss).
b) Re-processing : all of the jobs reached terminal status within 2.5 days of the start of the exercise. The
number of simulatenously running jobs peaked at over 1100 jobs at the beginning of day 2. The target of
simulatenous running jobs was sustained for a 24 hour period while the system was saturated with jobs.
Problèmes récurrents:
-------------------------
Pour LHCb: http://cctools2.in2p3.fr/elog/problemes-VO/100
AT Grille généralement:
----------------------------
- CE, BDII, VOMS...
- SE, FTS, LFC, SRM, dCache