visioconférence du groupe SA1-FR d'EGEE ======================================= Date : Mardi 30 Janvier 2007, 14h Présidé par: Pierre Girard Secrétaire: Osman Aidel Fonctionnement technique de la visioconférence: http://vacs.in2p3.fr/rms/guide.pdf Prochaine visioconférence : le mardi 13 février 2007 ***************** * Ordre du jour * ***************** 1) Approbation du compte-rendu de la dernière visioconférence (tous) http://agenda.in2p3.fr//askArchive.php?base=agenda&categ=a06166&id=a06166/minutes 2) Tour des sites (15') * Sujets particuliers : - Grid Site Policy https://edms.cern.ch/document/726129 - CC-IN2P3 - CPPM Marseille - LPC Clermont - CGG Massy - IPSL Paris - LAPP Annecy - LPSC Grenoble - GRIF Ile de France * CEA Saclay * IPN Orsay * LAL Orsay * LPNHE * LLR - SUBATECH Nantes - IRES Strasbourg - IPNL Lyon 3) "Partner Activity Review" (Rolf, Alistair, 10') http://indico.cern.ch/conferenceDisplay.py?confId=a063444 4) Tour des VOs (15') - AUVERGRID - BIOMED - DZERO - EGEODE - EMBRACE - ESR - FUSION 5) Compte-rendu LCG-France (Frédérique, 5') 6) Réunions/Conférences (5') - passées * All activity meeting + PMB, du 16 au 18 janvier, à Bologne http://indico.cern.ch/conferenceDisplay.py?confId=8752 * WLCG-OSG-EGEE operations meeting du 22 et 29 janvier http://agenda.cern.ch/displayLevel.php?fid=258 * WLCG Collaboration Workshop (Tier0/Tier1/Tier2), du 22 au 26 Janvier 2007, au CERN http://indico.cern.ch/conferenceDisplay.py?confId=3738 - à venir * LCG France T2/T3, mardi 31 Decembre, de 11:00 à 12:30 http://indico.lal.in2p3.fr/conferenceDisplay.py?confId=131 * WLCG-OSG-EGEE operations meeting du 5 et 12 février http://agenda.cern.ch/displayLevel.php?fid=258 * Karlsruhe SA1 meetings, du 5 au 8 février à Karlsruhe Meetings: ARM-9 COD-12 PAR-2-DECH PAR-2-FR PAR-2-SWE PAR-2-RU http://egee.in2p3.fr/events/workshop_karlsruhe/index.php?id=agenda 7) Divers (5') * Prochaine visio/télé-conférence: le mardi 13 février 2007 ##################################################################### *********** * Réunion * *********** 0) Liste de présence / site : ------------------------ - Absents annoncés : l'équipe de la CCG - CC.IN2P3.FR (2) Osman Aidel Pierre Girard - CGG.COM (0) - CLERMONT.IN2P3.FR (2) Emmanuel Medernach Jean-Claude Chevaleyre - CPPM.IN2P3.FR (0) - DAPNIA.CEA.FR (3) Christine Leroy Frédéric Schaer Pierrick Micout - IBCP.FR (0) - IPSL / IPGP (1) David Weissenbach - IPNL Lyon (3) Denis Pugnere Guillaume Baulieu Yoan Giraud - IRES.IN2P3.FR (1) Yannick Patois - LAL.IN2P3.FR (3) Cedric Duprilot Guillaume Philippon Michel Jouvin - LAPP.IN2P3.FR (2) Cécile Barbier Frederique Chollet Le Flour Muriel Gougerot - LPNHE.IN2P3.FR (0) - LPSC.IN2P3.FR(0) Christine Gondrand - SUBATECH.IN2P3.FR (1) Jean-Michel Barbet Total: 23 personnes 1) Approbation du compte-rendu de la dernière visioconférence (tous) ---------------------------------------------------------- http://agenda.in2p3.fr//askArchive.php?base=agenda&categ=a06166&id=a06166/minutes Approuvé. 2) Tour des sites (15') -------------- * Sujets particuliers : ******************** - Grid Site Policy: https://edms.cern.ch/document/726129 le Grid Site Policy est un document qui déclare les engagements qui seront à respecter par tous les sites (nouveaux et anciens). De ce fait, il est important que tous les sites lisent ce document afin de remonter tous points qui ne sembleraient pas clairs. - CC-IN2P3 ******** Mise à jour des WN en 11.0 mais suite à des problèmes de configuration de nombreux job atlas ont échoué ce qui a obligé le CC a repasser les WNs sur la version précédente (3.0.4). Problèmes avec AFS qui a entrainé la fermeture complète du site (Certificats en partage sur AFS) Problème sur un CE : les SFTs job-submission de SAM ont échoués. On observait de très nombreux globus-jobamanger pour le même utilisateurs, ce qui n'est pas normal. Quelques soupçons concernant un RB qui pose problème. Lundi prochain : un arrêt Oracle est prévus ce qui aura pour conséquence d'impacter les services LFC et FTS du CC - CPPM Marseille(0) ************** Demenagement de la salle machine - LPC Clermont ************ Le LPC compte annoncer un Scheduled downtime afin de mettre en place leur outil de monitoring Migration du SE toujours en cours. - CGG Massy ********* Mail de Gérald: CGG-LCG2 changera de noms à la prochaine update majeur de gLite en CGGVERITAS-FR Nous avons fait du support Fusion car des jobs étaient lancés directement via globus-job-run. Ceux-ci ont saturé notre CE. Restructuration de notre serveur Ganglia (http://se1.egee.fr.cgg.com/ganglia/ et http://se1.egee.fr.cgg.com:8080/ganglia/) et Nagios (http://se1.egee.fr.cgg.com/nagios) suite à une attaque d'une de nos machine ( serveur web d'EGEODE) par un cheval de troie ("shellbot"). Par la même occasion, nous avons trouvé des cartes et câbles réseaux défectueux que nous avons changés. La perte liée à l'attaque, aux câbles et cartes déféctueux était de +60% des paquets ! sur 2Mb/s (ça commence à être très pénalisant). Aujourd'hui tous ces problèmes sont résolus. Site en Glite 3.0 update 11 Pas de version Glite UI pour SL4 ! - IPSL Paris ********** David : installation des WNs SL4 sur de nouvelles machine Les jobs lhcb : ne passent plus depuis l'update. L'installation du soft de LHCB est recursive, il y a déjà un ticket GGUS concernant ce problème, et apparemment, il n'est toujours pas résolu. David invite les sites supportant lhcb à vérifier ce qui se passe concernant l'installation du software de LHCB. - LAPP Annecy *********** RAS - LPSC Grenoble ************* Le LPSC a reçus 14 machines (bi-proc et bi-core). Actuellement 2 d'entre elles sont utilisées comme WN. Une fois que le CE sera configuré et que la plate forme sera en place les 12 autres machines seront utilisées comme working node Une fois que le LPSC sera prêt Pierre enregistrera le site dans la GOC db (action sur Pierre ) - GRIF Ile de France ****************** * CEA Saclay * IPN Orsay * LAL Orsay * LPNHE * LLR Pas de problème majeur. Quelques soucis avec la commande de statut des job qui ne semble pas fonctionner correctement. Si quelqu'un à des pistes/suggestions qui pourraient expliquer ce comportement n'hésitez pas à contacter le GRIF? Quattor : Le problème de publication sur le template a été résolut. Pierre G. a demandé que cette information soit distribuée à tous les sites Le CE du LPNHE échoue les job-submit SFT, le pb ressemble à celui rencontré avec le CE du CC (nombreux jobmanager) Problème de publication d'accouting : lié à la JVM qui ne disposerait pas d'assez de mémoire - SUBATECH Nantes *************** Jean Michel : Absent du 5 au 17 fevrier. Problème avec les SFT de SAM au niveau de la publication des données d'accounting (apel) Toujours des problèmes avec le test (SAM) de replica management. Pierre G.: il ne faut plus utiliser le Top Bdii du CERN, la France doit installer son propre Top BDII et les sites français devraient l'utiliser. Michel J.: Il y a un Top BDII au LAL qui fonctionne si des sites veulent l'utiliser. - IRES Strasbourg *************** 8 WNs en production auquels s'ajouteront 12 autres machines par la suite - IPNL Lyon ********* En cours de reception de materiel. Test sur quattor pour deployer l'ensemble des services du site. Installation de la salle serveur. 3) "Partner Activity Review" (Rolf, Alistair, 10') ------------------------- http://indico.cern.ch/conferenceDisplay.py?confId=a063444 Une revue SA1 france dans le projet EGEE. Les federations CE et SE ont déjà passé cette revue, et c'est maintenant le tour d'Allemagne/Suisse, France et SEE. L'objectif de ces revues est de donner une vue sur les efforts fournis par les fédérations et de les comparer aux engagements qui avaient été définis initialement. Actuellement,pour la france on peut justifier l'argent que l'on recoit mais si certains labos ont des remarques à ajouter vous pouvez en faire part, il vous suffit juste de contacter Rolf Rumler. 4) Tour des VOs (15') ------------ - AUVERGRID ********* * RAS Action sur Pierre pour migrer les données du serveur LDAP vers le serveur VOMS. - BIOMED ****** * personne - DZERO ***** * personne - EGEODE ****** Mail de Gérald: 3 nouveaux utilisateurs (G.Kothe, F.Dequeker et P.Tertois) en attente de validation de leur certificat ! - EMBRACE ******* * personne - ESR *** * RAS - FUSION ****** * RAS 5) Compte-rendu LCG-France (Frédérique, 5') ----------------------- Une visio aura lieu le 01/02/2007 à 11h : sujet : - quattor - yaim - acl - configuration de torque Des transparents seront disponibles 6) Réunions/Conférences (5') -------------------- - passées ******* * All activity meeting + PMB, du 16 au 18 janvier, à Bologne http://indico.cern.ch/conferenceDisplay.py?confId=8752 Sujets principaux: Discussion sur la direction de developpement du middleware Un plan PMB pour stabiliser le middleware Coté application les VOs LHC ne veulent plus utiliser glite, ce qui peut amener les sites à fournir 2 CEs. * WLCG-OSG-EGEE operations meeting du 22 et 29 janvier http://agenda.cern.ch/displayLevel.php?fid=258 Pb remonté par la France: Echec trop fréquent des tests de réplication de SAM. Réponse: de nouvelles machines ont été ajoutées au top BDII du CERN, mais il faudrait de toute façon déployer un Top BDII Français. * WLCG Collaboration Workshop (Tier0/Tier1/Tier2), du 22 au 26 Janvier 2007, au CERN http://indico.cern.ch/conferenceDisplay.py?confId=3738 - à venir ******* * LCG France T2/T3, mardi 31 janvier, de 11:00 à 12:30 http://indico.lal.in2p3.fr/conferenceDisplay.py?confId=131 * WLCG-OSG-EGEE operations meeting du 5 et 12 février http://agenda.cern.ch/displayLevel.php?fid=258 * Karlsruhe SA1 meetings, du 5 au 8 février à Karlsruhe Meetings: ARM-9 COD-12 PAR-2-DECH PAR-2-FR PAR-2-SWE PAR-2-RU http://egee.in2p3.fr/events/workshop_karlsruhe/index.php?id=agenda 7) Divers (5') ------ * Prochaine visio/télé-conférence: le mardi 13 février 2007 Fin: 15:00