Réunion jointe Opération + AT Grille (22 Jun 2010)
Chaired by: Mr. Rumler, Rolf; Ms. CORDIER, Hélène
==================
Etat des projets Grille
==================
Participants : RR+ VD+JG+LS+SR
EGI-Inspire : Initialisation des timesheets. NGI_FRANCE operationnel. OMB le 29 /07/10.
IDG : Cloud computing journée à l'ENS : fin novembre / debut Decembre.VD demande s'il y a des dates qui entrenet en collision avec cette période.
LCG : ras
Grille régionale : la journée TIDRA grand public + utilisateurs + partenaires sera organisée avec la region; Yonny Tiffany et Pascal annonceront une date pour la rentrée de façon tardive (pour Octobre ?).
==================
Nouvelles des coopérations
==================
EELA/ GISELA : ?
Asie : ?
==================
Formation et dissémination
==================
VD attend des retours de Pierre G. et de Yannick L. VD prépare le rapport en anglais concernant les plans de formation et signalera les besoins de prise de parole à la réunion OPerations France-Grilles 06/07/10.
==================
Préparations transition ROC Fr --> NGI Fr
==================
1- Site Web: (besoin d'intranet : : IDG n'a pas de budget pour financer un intranet sur 2010. A voir avec Vincent Breton si on peut le faire sur les besoins de Dorine).
2- Plan d'Organisation des Opérations : Journée atelier en Octobre 2010 pour valider la structuration des opérations (RR)
==================
Affaires administratives
==================
Review EGEE-III : 23/24 Juin 2010
LCG-FR MRS: 24/25 Juin 2010
EGI technical Workshop : 14-17 Septembre 2010
Inauguration GIS France-Grilles : 24 Septembre 2010
Journée Atelier Operations France-Grilles: Octobre 2010
Journée outils pour le calcul scientifique en Rhône-Alpes : CHPID 29 Juin 2010 [SR]
Collaboration ENS/ DIET [FS : réponse à appel d'offres pour un ingénieur de recherche pour utiliser jsaga pour interagir avec DIET émuler gridrpc sur des grilles glite] -- faire un point dans la rubrique coopérations / projet grille.
HC Jeudi /vendredi 24/25 Juin.
==================
Incidents et problèmes des VOs (CC, sites français, autres sites)
==================
Impliquer Yvan Calas pour l'implication.
Exploitation:
Bilan semaine uploadé, manque le week-end : comment on peut faire apparaître
les interventions du week-end ? [NL]
1- Jobs slows sur CMS -T2, pb non clarifié à ce jour. Problème depuis 15 jours cms019.
2- L'utilisateur D0 qui a saturé un CE en utilisant JJS. PG a réglé le problème en direct : RR mentionne que ce type d'interaction avec l'utilisateur devrait être traité par l'exploitation / support??.
Support :
CMS :
1- AFS timeout après l'update des CRLS ? n/a
2- gtfp timeout's : n/a -- voir Yvan ?
ATLAS : slow jobs et dégradation du LFC ce week-end : Deux machines de LFC dont l'installation n'était pas homogène : la répartition de la charge - load balancing sur alias non validé. Mais le principe de fonctionnement de lbnamed a masqué le symptôme - puisque il y a avait toujours une machine derrière l'alias.
Mettre en place des tests sur toutes les machines FTS et LFC une à une ou test du service seulement --- Définition des critères que l'on peut supporter ??? voir avec David?? prendre en compte "lbnamed"?
LS précise qu'un soft "balance" est utilisé pour la haute dispo pour les portes dcap. à suivre [HC]
**** AT Grille
Tests de glexec en cours.
2 CREAM-CE installés et non surchargés, d'autres en prévision mais avec machines demandées il y a 2 semaines. Sonde Nagios spécifique au Cream WN-BIops - CE toujours en erreur: remonté au niveau du projet?
Mise à jour des CAs sur AFS et NagiosBox par Jacques Garnier -- beaucoup de changement dans la liste d'enregistrements. MAJ des CA pour les services et pour dcache. Communiquer à cic-information et à nagiosmaster en sortie.
[NL/JG] Renommer l'entrée dans le wiki crl/grille en cacrl/grille et si exploitation valide de demander à crlmaster de mettre à jour la fiche.
==================
Charge et événements prévisibles pour la semaine à venir
==================
*** ANNONCE de CHARGE DE TRAVAIL
[HPSS, ATLAS] Vérifier que les Atlas et HPSS master sont en liaison.
[LS] Transfer lents en provenance de BNL problème grave pour Atlas: installation de portes gridftp sour linux : workaround pour augmenter le débit: A vérifier et installation de machines virtuelles gridftp.
==================
Nouvelles des équipes du CC
==================
LS arrivée dans l'équipe développement et recrutement en cours dans l'équipe infrastructure.
==================
Divers
==================
- Identification de la salle machine en panne ? [à faire remonter par les services généraux]
- LCG : (notification des alertes NAGIOS par le portail des Operations et d'utiliser les fonctionnalités de Nagios [NL, PG], notamment l'historique pour le debugging).
Reporting : Réutiliser l'ancienne focntionnalité des sites reports (?)
Il y a un compte-rendu associé à cet événement.
Les afficher.