Sujets Exploitation+Stockage:
----------------------------------
Lundi :
- modification des délais dans l'outil de surveillance des jobs "slow" : message au bout de 6h, et suppression
du job au bout de 12h.
- sortie de production des workers a Montpellier car coupure réseau du 22 au 23/06
- lecteur OF1A (LTO4) drained pour tests LTO4 dans HPSS.
Mardi :
- arret électrique des workers a Montpellier
- bilan sur les modification de kernel pour eviter le gel des workers : la modification semble efficace. a
suivre sur une plus longue période
- beaucoup de jobs "slow" pour atlas. le support adapte la valeur de la ressource u_dcache_atlasT2.
- modification des ressources u_dcache_lhcb et u_dcache_lhcbt2 car beaucoup de jobs sur T2 et rien sur T1. il
faudra certainement revoir les valeurs quand ils soumettront sur le T1
Mercredi : RAS
Jeudi :
- retour en production des workers de Montpellier vers 14h
- sortie de production des machines ccwl0060->ccwl0123, machines qui ont le kernel modifié et modification
ccautofs car il semble y avoir des problèmes d'accès dans des cas assez isolés.
- blocage des ressources sps_snovae pour migration de l'espace.
- problème de disque sur le serveur de smurf. Certains courbes ne sont pas mises a jour.
Vendredi :
- ccafs11 heavy load : szollosi qui travaille dans l'espace groupe de biometr - Pascal le contacte.
- les machines ccwl0092 -> ccwl0123 sont vides. Yannick les ré-installe avec toujours le kernel modifié, mais
l'ancien client ccautofs.
- migration espace sps snovae terminé. ressources libérées.
- qvar set -s Objective=liris@anastasie MaxRunningJobs=800 car peu de jobs LHC.
Divers :
pensez a faire le point avec Yannick lundi vers 15h30-16h. Il devrait donner les nouvelles machines de la LAF
semaine 26, mais pas l'unité de stockage.
Sujets Support:
-------------------
Problèmes récurrents:
-------------------------
AT Grille généralement:
----------------------------
- CE, BDII, VOMS...
- SE, FTS, LFC, SRM, dCache