Réunion jointe Opération + AT Grille
mardi 27 janvier 2009 -
16:00
lundi 26 janvier 2009
mardi 27 janvier 2009
16:00
Accueil de Marcos LINS
-
Rolf
Accueil de Marcos LINS
Rolf
16:00 - 16:05
Room: 322
16:05
Incidents et problèmes des VOs (CC, sites français, autres sites)
-
Tous
Incidents et problèmes des VOs (CC, sites français, autres sites)
Tous
16:05 - 16:30
Room: 322
Sujets Stockage: ------------------- - HPSS: Sujets Exploitation: ------------------------ Mardi 20 janvier Intervention BQS : Maintenance matérielle (contrôleur disques et 1 disque remplacés) et re-installation complète de la machine La ferme a été lockée de 13h15 a 14h15 le spawn re-ouvert vers 14h40 Mercredi 21 janvier BQS : Passe de sched trop longue quand il y a trop de job en queue BQS a du mal on a reduit le nombre de jobs par passe et on cosei Un volume AFS ccafs022 pour ATLAS se retrouve surchargé pour les raisons suivantes - Certains jobs T1 atlas050 l'accédent en RO - Certains jobs font la mise à jour du soft de ATLAS Alors on a ralenti l'entree en machine des jobs du groupe pour laisser l'install se faire tranquillement pendant la journée..Et on a dupliqué un volume pour permettre la transition vers cette nvelle release sans trop de dégats. Autre : Le RC report montre que les tests sur notre site liés au Close SE échouent et le mettent évidement en échec pour le probléme suivant : le BDII ne semble pas être renseigé correctement sur le SRM SE. Probléme en cours. Lundi 26 Janvier Arrêt SRM : SRM core servers to be changed. FTS file tranfers from or to IN2P3-CC will be impossible during this downtime.et Dcache en ce moment Sujets Support: ------------------- Atlas: ====== * Le BQS manager installe par Pierre Girard sur les CEs cclcgceli02 et cclcgceli06 permet (comme desire) de rentrer beaucoup de jobs de ATLAS. Pierre a fait une derniere manip. dessus hier, il faut donc verifier cela dans 24 heures. * Update sur les transferts T1-T1 qui etaient lents (deja presente la semaine derniere): le goulot d'etranglement semble etre au niveau de la charge des machines FTS. David Bouvet a installe une machine supplementaire et a equilibre les agents entre les 3 machines. Amelioration a confirmer. ATLAS va mener la meme campagne de tests exactement en fevrier (la daten'est pas fixee). * Des jobs slow de production ATLAS du a des realease toujours en RW (le volume devait etre mis a jour donc il fallait le paser en RW). * Des erreurs sur les jobs de production ATLAS par paquets (une fois / semaine depuis 3 semaines) liees a LFC. En cours. News de David Bouvet : certainement liees a un proxy expire (cote utilisateur ou machine mais pas LFC). * Notification de la GOC DB pas distribue correctement. Probleme trace par Osman et remonte a un bug dans le code. Fixe maintenant. * Apres la fin du downtime de dCache hier, des problemes avec la reservation pour ATLAS. Aucun transfert jusqu'a ce matin vers 9h30. Notification du probleme a 19h22 a lagaffe et dcachemaster. CMS: ==== * SAM: jobs never start (please see *). Is it due to the dCache downtime http://dashb-cms-sam.cern.ch/dashboard/request.py/testhistory?servicename=cclcgceli03.in2p3.fr&services=CE&timeRange=individual&start=2009-01-20&end=2009-01-27&sites=T1_FR_CCIN2P3 * Reprocessing jobs: - Symptoms: failed of some reprocessing jobs on 23th January - Cause: libGLU package was missing at some WNs. - Explanation: The lack of this lib maybe due to the installation problems. - Solution: The few WNs concerned have been upgraded. * Transfers: the down transfers from CCIN2P3 were quite poor last week, because of the FTSchannels were overload by the ATLAS transfers. Alice: ====== * Still no Alice jobs at CC, site is ok, production not yet started. LHCb: ===== * Nothing to report. AT Grille généralement: ---------------------------- - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCache
16:30
Charge et événements prévisibles pour la semaine à venir
-
Tous
Charge et événements prévisibles pour la semaine à venir
Tous
16:30 - 16:35
Room: 322
Demandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérêt général. Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général.
16:35
Nouvelles des équipes du CC
-
Un membre de chaque équipe
Nouvelles des équipes du CC
Un membre de chaque équipe
16:35 - 16:40
Room: 322
Sujets par équipe, avec un impact potentiel sur l'exploitation. - AT Grille: besoins Symod Nouvelles des embauches
16:40
break
break
16:40 - 16:45
Room: 322
16:45
Etat des projets Grille
Etat des projets Grille
16:45 - 16:55
Room: 322
- EGEE (Pierre) - EGI-DS (Rolf) - IdG (Rolf, Virginie, Yonny) - LCG (Pierre) - Grille régionale (Yonny) et projets en préparation, le cas échéant.
16:55
Nouvelles des coopérations
Nouvelles des coopérations
16:55 - 17:00
Room: 322
- EELA et participation à la conférence EELA-2 (Cyril)
17:00
Affaires administratives
Affaires administratives
17:00 - 17:05
Room: 322
- Missions et absences dans la semaine à venir - Conférences / workshops annoncés
17:05
Divers
Divers
17:05 - 17:10
Room: 322