Sujets Exploitation+Stockage:
----------------------------------
- Mardi : Arrêt et bilan cf wiki.
Ressource dcache augmentée avec modération.
Jobs slow de CMS
Bila au support vo pour faire le tour des besoins en memoire des jobs pr vérifier que tt est OK.
Une seule réponse : celle de ALICE!
- Mercredi : plusieurs incidents suite au redémarrage : BQS cuurently locked.
Repropagation des va. redémarrage de certaines machines. Redemarrage de BQSD.
ccxrdsn024 est en cours de maintenance : sortie de la surveillance nagios.
- Jeudi : pbm PL et ressource u_sps_d0. Il n'est d'accord sur le maxAvailable et veut l'augmenter.
Mais ses jobs saturent la bande passante du serveur qui héberge d'autres espaces : 400Mo/400!
Migration de la machine MAGO effectuée. Un incident : job disappeared sur machine malade n'a
pas été detecté. Incident transmis à JD.
Vendredi : RAS. Pas de RC report..
Sujets Support:
-------------------
_Atlas :_
**** Problème de transfert de gros fichiers (>=10GB) Tokyo-CC
Le temps de transfert d'un fichier de 10GB est bien supérieur au timeout mis de 3600s. David a augmenté le timeout à 4500s. Mais comme il n'est pas prévu de transférer des fichiers de cette taille, nous avons demandé à Atlas d'arrêter ce qui a été fait. Les timeouts ont été remis par David à 3600s.
***** La nouvelle vobox de Atlas cclcgatlas03 a été installée et livrée à Atlas pour l'installation de PANDA. Cela a mis quand même près d'une année.
***** Beaucoup d'activité de processing de Atlas sans problème particulier.
_CMS :_
Tout va bien
_LHCb :_
Plus de problèmes d'accès aux fichiers via dcap avec la nouvelle version de ROOT.
Problèmes récurrents:
-------------------------
AT Grille généralement:
----------------------------
- CE, BDII, VOMS...
- SE, FTS, LFC, SRM, dCache