Sujets exploitation - Marc Hausard:
-Arrêt 15 Octobre
-Pb tests SAM 11 et 12 oct sur lcgce01 et lcgce02
-Soumission massive atlas
===
Sujets Support Yvan Calas:
Atlas:
- Tests de prestaging repris lundi après midi en collaboration avec les experts dcache et HPSS. On constate un débit faible de
staging (~.5 To/heure ). Pour notre capacité CPU, il faudrait environ 1.5 To/Heure. Problème actuellement en cours d'étude.
- Beaucoup de jobs pilotes qui ne consommaient pas de CPU. Cela etait du au fait que Atlas n'avait plus de jobs de production à faire tourner sur notre site.
Projet d'adaptation automatique du nombre de jobs pilotes aux nombre de jobs réels envoyés sur notre site pour éviter de surcharger BQS.
CMS:
T1's CE
*********
- Pierre has performed some modification on both cclcgceli03 and cclcgceli04 to avoid the access of Normal jobs to T1 queues.
- Due to this modification the T1_FR_CCIN2P3 was not visible in BDII. since Thursday until Monday 21th October at 16.h.
- CMS use the LCG Savanna to address this kind of issue. A fix was provided by Pierre on Sunday, but its propagated was required many time to get to the person, who was submitted the ticket (Ticket was closed on Monday 16:00h).
- I have reported in the CMS Facility Operation meeting the needs of using the GGUS for this kind of trouble.The fact that CCIN2P3 has already implemented an interface to GGUS will allow the side admins to be quickly notified about the ticket, and then the people can be get updated regarding any progress in the ticket in question in a reasonable time scale.
Tape Families
***********
- CCIN2P3 is the only CMS T1 that has not implemented yet the Tap families. I have already talked to Lionel in several times. But I think we need to have an agreement between the master of the Storage System (dCache + HPSS) and us on the best way to implement that accommodating the CMS proposal and respecting the limitation that could has our Storage System.
AT Grille généralement - Pierre Girard:
-CE, BDII, VOMS, ...
-SE, FTS, LFC, SRM, DCache
- Mise en place d'une nouvelle version des WN (3.1.19) accessible depuis tous les CEs T1/T2
- Installation et livraison de 3 VO Boxes
* cclcgcms03 pour CMS
* cclcgatlas03 pour ATLAS
* cclcgsamap01 pour la SAM Admin page (Rafal)
- Mise à jour des UIs, utilisée uniquement par les nouvelles VO Boxes pour l'instant
- A la demande des sysadmins:
* Jeu des chaises musicales sur les CEs pour upgrade du firmware (tous les CEs ont été sorti de production par lot de 3)
* sortie d'un CE (cclcgceli03) de production depuis vendredi pour autopsie par les experts IBM (qui ne sont pas encore venus).
Attention: il n'y a plus de rédondance sur certaines VOs pour le T1.
Si le CE cclcgceli04 tombe, il faut intervention rapide d'un sysadmin pour le redémarrer.
A faire (par ordre de priorité):
- mise en prod sur les ccali de la nouvelle version des UIs
- modification des logname (pas de planning)
- mise-à-jour des CEs (pas de planning)
- implémenter les share sur le jobmanager et l'information provide des CE
Pour finir, pas de gridmaster officiel la semaine prochaine jusqu'à jeudi.