Sujets Exploitation+Stockage:
----------------------------------
- migration en SL5 des machines qui vont partir a Montpellier - 73 en production sur les 120 (sortie lundi - revenues jeudi)
- augmentation de l'objectif de glast pour qu'ils aient 600 jobs en machine (bien laisser cette valeur car production par pic).
- alarmes de température sur les workers mercredi et jeudi : des travaux de raccordement de distribution d'eau pou les nouveaux racks rithal faisait que des dalles etaient enlevées et l'air froid etait mal reparti.
- plus de 100 workers ont rebooté vendredi matin. Est-ce du aux patchs de sécurité? pour le moment pas de diagnostic établi.
- arrêt de ccsrm02 lundi 30/11 pour changement de serveurs. job pour drainé la ressource u_dcache_egee le 29/11 vers 22h.
- peu de jobs LHC en queue hier soir : problème de publication de l'espace libre (reglé hier soir par dCachemasters)
- ccwl0621 dedié a planck car leur ancienne machine ccwl0293 est en SL5 et ils ne peuvent pas l'utiliser.
- problème de charge sur un serveur afs ccafs21, du a une entrée massive de jobs de cms050 -> ressources u_dcache_cmsf et u_dcache_cmsft2 ont ete limitées. A suivre.
- 200 machines a sortir de production pour appliquer les patchs sécurité. Job pour les sortir dimanche matin a 10h.
- 2 bandes ont des problemes de lecteur : une en recopie chez SUN, l'autre en analyse (1 seul fichier). une troisième a un MIR défectueux, impossible a reconstruire. la copie (conseillée par SUN) a pris plus de 10h (>12000 fichiers pour 300Go), elle s'est terminée en erreur. les hpssmasters vont faire le repack, et on verra ensuite ce qui manque. Il faudrait tenter une 2eme copie (cf SUN).
Sujets Support:
-------------------
Problèmes récurrents:
-------------------------
AT Grille généralement:
----------------------------
- CE, BDII, VOMS...
- SE, FTS, LFC, SRM, dCache