LCG-France Tier-1 & Analysis Facility -- 2012-05
→
Europe/Paris
202
202
Description
Réunion mensuelle de suivi des activités des sites Tier-1, Tier-2 et AF LCG-France.
===============================
Minutes T1/AF 31 Mai 2012
===============================
Presents: Yvan, Manolis, David, Aresh, Vanessa, Suzanne, Pierre-Etienne, Ghita, Pierre G., Tibor, Rolf, Renaud.
Pierre (status deploiement et migrations middleware)
----------------------------------------------------
EMI2 disponible depuis Mai, mais il faut deja deployer EMI1, c'est une priorite.
Note: pas de backward-compatibility garantie avec EMI1.
Pour plus d'info, consulter Jacques Garnier.
Sebastien fait remarquer que le passage a EMI est une etape importante pour CMS.
Objectif de deploiement EMI :
cccreamceli09,10 -> experiences non-LHC (VM)
07,08 -> T2
05,06 -> T1
02 -> en test par CMS
02, 05, 07 et 09 migres
06, 08 et 10 seront migres en juin.
siteBDII et topBDII :
siteBDII : est sous SL4, migration urgente vers SL5 avec EMI. migration et tests en cours.
topBDII : caching peut etre mis en place avec EMI, c'est benefique donc migration urgente egalement car ca pose des problemes aux autres sites.
Il faut definir une date de migration rapidement.
Vobox : pas supporteees par EMI, donc restent en gLite
migration glite 3.2.0-0 vers 3.2.14-1 (fix renewproxy) en cours
dependance forte sur les UI, donc deploiement rapide des UI aussi est aussi souhaite pour la compatibilite.
WN : on reste sous gLite (EMI deconseille par WLCG)
migration gLite recent en cours.
Aresh (activites LHCb au CC)
----------------------------
Probleme memoire des jobs :
queue speciale temporaire mise en place, probleme a resoudre
Pilotes :
le pilote incapable de calculer le temps restant pour le job
il prend un payload et sort
periode de jobs courts avec LHCb -> pilotes courts, a resoudre car ca penalise tout le monde.
un patch de Dirac est en cours de deploiement sur certains sites, Aresh doit suivre ca
on peut envisage d'ouvrir un ticket GGUS pour ca, car il n'en existe pas encore
WN :
Yvan demande expressement (comme d'autres sites) a ce qu'LHCb utilise protocole dccp pour copie SRM->WN.
J'ai demande a Aresh de transferer cette demande au phone meeting LHCb
Fichiers corrompus:
investigations en cours, grid-ftp semble etre le usual suspect
pas de checksum utilise, ni pour FTS, ni pour copie WN->SRM
les corruptions existent ailleurs que chez nous (David) et pour les autres VO, qui verifient le checksum.
peut etre faudrait-il demander au CERN de nous donner une statistique sur les transferts T0->T1
KIT a ete contacte pour nous donner leurs statistiques de corruption.
AOB:
----
Tibor demande acces aux WN depuis l'IPNL.
Il faut voir avec Benoit et PEM comment faire, avec quel statut.
Minutes T1/AF 31 Mai 2012
===============================
Presents: Yvan, Manolis, David, Aresh, Vanessa, Suzanne, Pierre-Etienne, Ghita, Pierre G., Tibor, Rolf, Renaud.
Pierre (status deploiement et migrations middleware)
----------------------------------------------------
EMI2 disponible depuis Mai, mais il faut deja deployer EMI1, c'est une priorite.
Note: pas de backward-compatibility garantie avec EMI1.
Pour plus d'info, consulter Jacques Garnier.
Sebastien fait remarquer que le passage a EMI est une etape importante pour CMS.
Objectif de deploiement EMI :
cccreamceli09,10 -> experiences non-LHC (VM)
07,08 -> T2
05,06 -> T1
02 -> en test par CMS
02, 05, 07 et 09 migres
06, 08 et 10 seront migres en juin.
siteBDII et topBDII :
siteBDII : est sous SL4, migration urgente vers SL5 avec EMI. migration et tests en cours.
topBDII : caching peut etre mis en place avec EMI, c'est benefique donc migration urgente egalement car ca pose des problemes aux autres sites.
Il faut definir une date de migration rapidement.
Vobox : pas supporteees par EMI, donc restent en gLite
migration glite 3.2.0-0 vers 3.2.14-1 (fix renewproxy) en cours
dependance forte sur les UI, donc deploiement rapide des UI aussi est aussi souhaite pour la compatibilite.
WN : on reste sous gLite (EMI deconseille par WLCG)
migration gLite recent en cours.
Aresh (activites LHCb au CC)
----------------------------
Probleme memoire des jobs :
queue speciale temporaire mise en place, probleme a resoudre
Pilotes :
le pilote incapable de calculer le temps restant pour le job
il prend un payload et sort
periode de jobs courts avec LHCb -> pilotes courts, a resoudre car ca penalise tout le monde.
un patch de Dirac est en cours de deploiement sur certains sites, Aresh doit suivre ca
on peut envisage d'ouvrir un ticket GGUS pour ca, car il n'en existe pas encore
WN :
Yvan demande expressement (comme d'autres sites) a ce qu'LHCb utilise protocole dccp pour copie SRM->WN.
J'ai demande a Aresh de transferer cette demande au phone meeting LHCb
Fichiers corrompus:
investigations en cours, grid-ftp semble etre le usual suspect
pas de checksum utilise, ni pour FTS, ni pour copie WN->SRM
les corruptions existent ailleurs que chez nous (David) et pour les autres VO, qui verifient le checksum.
peut etre faudrait-il demander au CERN de nous donner une statistique sur les transferts T0->T1
KIT a ete contacte pour nous donner leurs statistiques de corruption.
AOB:
----
Tibor demande acces aux WN depuis l'IPNL.
Il faut voir avec Benoit et PEM comment faire, avec quel statut.
Il y a un compte-rendu associé à cet événement.
Les afficher.