visioconférence du groupe SA1-FR d'EGEE ======================================= Date : Mardi 17 Avril 2007, 14h Présidé par: Pierre Girard Secrétaire: David Bouvet Fonctionnement technique de la visioconférence: http://vacs.in2p3.fr/rms/guide.pdf Prochaine visioconférence : le mardi 15 Mai 2007 ***************** * Ordre du jour * ***************** 1) Approbation du compte-rendu de la dernière visioconférence (tous) http://indico.in2p3.fr/materialDisplay.py?materialId=minutes&confId=217 2) Tour des sites (30') * Sujets particuliers : - Ticket GGUS OK !! - CC-IN2P3 - CPPM Marseille - LPC Clermont - CGG Massy - IPSL Paris - LAPP Annecy - LPSC Grenoble - GRIF Ile de France * CEA Saclay * IPN Orsay * LAL Orsay * LPNHE * LLR * APC - SUBATECH Nantes - IRES Strasbourg - IPNL Lyon 3) Tour des VOs (10') - AUVERGRID - BIOMED - DZERO - EGEODE - EMBRACE - ESR - FUSION 4) Compte-rendu LCG-France (Frédérique, 5') 5) Réunions/Conférences (5') - passées * GDB Meeting, le 3 avril à Prague http://indico.cern.ch/conferenceDisplay.py?confId=8471 * LCG France T2/T3, 5 avril , de 14:00 à 15:00 http://indico.in2p3.fr/conferenceDisplay.py?confId=179 * WLCG-OSG-EGEE operations meetings du 16 avril http://indico.cern.ch/conferenceDisplay.py?confId=14831 * ROC phone conference du 17 avril http://indico.cern.ch/conferenceDisplay.py?confId=14069 - à venir * LCG France T2/T3, du 25 avril, de 09:30 à 11:00 http://indico.in2p3.fr/conferenceDisplay.py?confId=229 du 10 mai, de 14:00 à 15:30 http://indico.in2p3.fr/conferenceDisplay.py?confId=230 * WLCG-OSG-EGEE operations meetings du 23 avril http://indico.cern.ch/conferenceDisplay.py?confId=15058 * ROC phone conference du 2 mai http://indico.cern.ch/conferenceDisplay.py?confId=14070 * GDB Meeting du 2 mai au CERN http://indico.cern.ch/conferenceDisplay.py?confId=8472 6) Divers (5') * Prochain "Grid Operations Workshop" à Stockholm, du 13 (14:00) au 15 juin (13:00) http://www.egee-ne.org/events/sa1event * ATTENTION: prochaine visio/télé-conférence: le mardi 15 mai 2007 ##################################################################### *********** * Réunion * *********** 0) Liste de présence / site : ------------------------ - Absents annoncés : David Weissenbach (présent... puis absent faute de ligne téléphonique sur la conférence) - CC.IN2P3.FR (4) David Bouvet Helene Cordier Pierre Girard Pierre-Emmanuel Brinette - CGG.COM (2) Ahmed Beriache Jean-Bernard Favreau - CLERMONT.IN2P3.FR (2) Emmanuel Medernach Jean-Claude Chevaleyre - CPPM.IN2P3.FR (2) Edith Knoops Thierry Mouthuy - DAPNIA.CEA.FR (2) Pierrick Micout Zoulikha Georgette - IBCP.FR (0) - IPSL / IPGP (0) - IPNL Lyon (2) Denis Pugnere Thierry Ollivier - IRES.IN2P3.FR (0) - LAL.IN2P3.FR (3) Cedric Duprilot Guillaume Philippon Michel Jouvin - LAPP.IN2P3.FR (4) Cécile Barbier Eric Fede Frederique Chollet Le Flour Muriel Gougerot - LPNHE.IN2P3.FR (0) - LPSC.IN2P3.FR(0) - SUBATECH.IN2P3.FR (1) Jean-Michel Barbet Total: 22 personnes 1) Approbation du compte-rendu de la dernière visioconférence (tous) ---------------------------------------------------------- http://indico.in2p3.fr/materialDisplay.py?materialId=minutes&confId=217 2) Tour des sites (30') -------------- * Sujets particuliers : ******************* - Ticket GGUS OK !! - CC-IN2P3 ******** Un top BDII a été installé. Dans un premier temps, il ne sera utilisé que par le CC pour évaluer la charge, puis après validation, il sera proposé à la fédération FR. Arrêt complet du CC : 21 mai 2007. Maintenance électrique. - CPPM Marseille ************** Dernière mise à jour gLite hier. Passage sur le top BDII du LAL. Serveur disque DPM en 64 bit mais pas de version compatible actuellement. A venir bientôt : en phase de tests finale. Disponibilité d'une version bêta pour ne pas attendre la certification ? Problème avec machine HP : CD de diagnostique pour machine sans CD. - LPC Clermont ************ RAS Problème un utilisateur ATLAS qui saturait la zone temporaire des WN. La zone n'était pas nettoyée car le job ne se terminait pas du fait du remplissage. - CGG Massy ********* Upgrade 20 en cours. - IPSL Paris ********** Résolution du problème de mail suite à la coupure de courant. - LAPP Annecy *********** Support de GEANT4 comme VO. Même pb que le LPC avec ATLAS. Autre pb avec ATLAS : des jobs ATLAS de prod qui tournaient en tant que SGM. L'utilisateur avait mal généré son proxy. - LPSC Grenoble ************* Personne - GRIF Ile de France ****************** * CEA Saclay Coupure électrique dans la nuit de jeudi à vendredi. Frédéric a résolu le pb d'accounting (tout n'était pas publié). Nouvel version d'APEL. * IPN Orsay * LAL Orsay Pb avec un RB : le RB déclarait des proxy valides comme non valides. Alias sur top BDII : topbdii.lal.in2p3.fr 5To en cours d'ajout sur le SE. Arrêt définitif du RB grid09.lal.in2p3.fr au 15 mai. Transformé en gLite WMS. * LPNHE * LLR * APC En cours de déploiement avec quattor. - SUBATECH Nantes *************** Update 20 sur CE et VOBOX. Le reste va suivre. Test du drainage de DPM : pas de déplacement de données. Michel : Si les variables DPM_HOST et DPMS_HOST ne sont pas remplies avant la commande dpmdrain, la commande ne fonctionne pas et ne retourne pas d'erreur. A étudier : les tests de SPEC : les tests faits par GridKa semble plutôt correctes. Frédérique Chollet a demandé à ce que le ROC se renseigne auprès du projet sur ce point. - IRES Strasbourg *************** VOBOX ALICE fonctionne mais les jobs ne passent pas. VOBOX CMS en cours d'installation. L'installation de la VOBOX pour ALICE est faite par ALICE (Patricia Mendez) L'installation de la VOBOX CMS est faite par le site, et suivi par CMS. Pour l'installation de PheDeX, il faut fournir l'architecture du stockage. Il faut aussi régulièrement contacter des personnes de CMS pour passer à l'étape suivante de la configuration, ce qui rallonge l'installation. CMS est conscient de pb de documentation, et est en train de corriger le tir. - IPNL Lyon ********* Réception d'une partie du matériel. Début d'installation de GPFS. Jobs longs pour la VO ipnl et problème avec les proxy VOMS. Il est pas exclu d'utiliser qsub pour ces jobs très longs. Demande de certificat GRID-FR : Alice ne pouvait pas rattacher ces demandes à des VO, et demandait d'utiliser des certificats CNRS-Standard. Edith : il n'y a pas de raison qu'Alice demande ça. 3) Tour des VOs (10') ------------ - AUVERGRID ********* Sylvie n'a pas eu de réponse des utilisateurs pour la migration à VOMS. Proposition de mettre une date limite pour fermer le serveur LDAP. - BIOMED ****** Personne - DZERO ***** Personne - EGEODE ****** RAS - EMBRACE ******* Personne - ESR *** Problème de connection avec David W. Désolé. - FUSION ****** Début de travail avec Java. 4) Compte-rendu LCG-France (Frédérique, 5') ----------------------- Focalisation sur l'accounting notamment concernant les SPECInt. Il faudrait mettre GlueArchitectureSMPSize à la valeur du nombre de processeur physique, et être en mesure de collecter une valeur correcte de SPECInt. Au niveau de HEPIX et LCG MB, il y a discussion sur ces valeurs. Autre question sur les clusters hétérogènes. Les retours sont les bienvenus. 5) Réunions/Conférences (5') -------------------- - passées ******* * GDB Meeting, le 3 avril à Prague http://indico.cern.ch/conferenceDisplay.py?confId=8471 * LCG France T2/T3, 5 avril , de 14:00 à 15:00 http://indico.in2p3.fr/conferenceDisplay.py?confId=179 * WLCG-OSG-EGEE operations meetings du 16 avril http://indico.cern.ch/conferenceDisplay.py?confId=14831 Les développeurs de RGMA étaient invités à s'expliquer sur la non collection des données dans le registry. Réponse de John Gordon : saturation de RGMA par les SAM tests qui sont lancés dans chaque job de la grille via le job wrapper. Piotr devait aussi expliquer pourquoi les SAM tests dans les jobs wrapper restent pendus : ils le sont sur la publication dans RGMA. 2 systèmes de publication pour SAM : RGMA et un système propre à SAM. Il a été demandé de désactiver les tests SAM sur les WN. Pierre fera suivre le lien explicatif. Développeur de RGMA : script à mettre en place sur la MONBOX qui surveille la mémoire utilisée par la JVM, et qui redémarre Tomcat si nécessaire. Cyril l'a testé, et cela ne semble pas vraiment fonctionner. Pierre avait demander une documentation sur le mécanisme de mapping avec VOMS. La réponse apportée n'est pas satisfaisante : ouverture d'un ticket GGUS sur le mécanisme de mapping VOMS. * ROC phone conference du 17 avril http://indico.cern.ch/conferenceDisplay.py?confId=14069 - à venir ******* * LCG France T2/T3, du 25 avril, de 09:30 à 11:00 http://indico.in2p3.fr/conferenceDisplay.py?confId=229 du 10 mai, de 14:00 à 15:30 http://indico.in2p3.fr/conferenceDisplay.py?confId=230 * WLCG-OSG-EGEE operations meetings du 23 avril http://indico.cern.ch/conferenceDisplay.py?confId=15058 * ROC phone conference du 2 mai http://indico.cern.ch/conferenceDisplay.py?confId=14070 * GDB Meeting du 2 mai au CERN http://indico.cern.ch/conferenceDisplay.py?confId=8472 6) Divers (5') ------ * Prochain "Grid Operations Workshop" à Stockholm, du 13 (14:00) au 15 juin (13:00) http://www.egee-ne.org/events/sa1event * ATTENTION: prochaine visio/télé-conférence: le mardi 15 mai 2007 Fin: 15:00