visioconférence du groupe SA1-FR d'EGEE ======================================= Date : Mardi 11 septembre 2007, 14h Présidé par: Pierre Girard Secrétaire: Pierre-Emmanuel Brinette Fonctionnement technique de la visioconférence: http://vacs.in2p3.fr/rms/guide.pdf Prochaine visioconférence : le mardi 25 septembre 2007 ***************** * Ordre du jour * ***************** 1) Approbation du compte-rendu de la dernière visioconférence (tous, 5') http://indico.in2p3.fr/materialDisplay.py?materialId=minutes&confId=315 2) Tour des sites (tous, 25') * Sujets particuliers : - Pool of accounts pour SGM et PRD - Ticket GGUS: Bravo, c'est à peu près à jour !!!! https://gus.fzk.de/ws/ticket_search.php?supportunit=ROC_France&status=open&radiotf=1&timeframe=no - CC-IN2P3 - CPPM Marseille - LPC Clermont - CGG Massy - IPSL Paris - LAPP Annecy - LPSC Grenoble - GRIF Ile de France * CEA Saclay * IPN Orsay * LAL Orsay * LPNHE * LLR * APC - SUBATECH Nantes - IRES Strasbourg - IPNL Lyon 3) Tour des VOs (5') - AUVERGRID - BIOMED - DZERO - EGEODE - EMBRACE - ESR - FUSION 4) Ateliers "Sécurité" et "Batch System" (Tous, 10') Pages d'inscription et agendas préliminaires accessibles depuis: http://egee.in2p3.fr/events/ 5) Compte-Rendu LCG-France (Frédérique, 5') 6) Réunions/Conférences (5') - passées * CHEP du 2 au 7 septembre à , Victoria, Canada http://www.chep2007.com/ * GDB Meeting, le 31 aout, à TRIUMF http://indico.cern.ch/conferenceDisplay.py?confId=8487 * WLCG-OSG-EGEE Operations meeting, du 10 septembre http://indico.cern.ch/conferenceDisplay.py?confId=20374 - à venir * LCG-France T2-T3 Technical meeting du 14 septembre 2007 http://indico.in2p3.fr/conferenceDisplay.py?confId=360 * WLCG-OSG-EGEE Operations meeting, du 17 septembre http://indico.cern.ch/conferenceDisplay.py?confId=20895 * ROC managers phone conference, du 18 septembre http://indico.cern.ch/conferenceDisplay.py?confId=14080 7) Divers (5') * Confirmation d'une session EGEE France à la conférence EGEE07 : slot réservé le mardi 2 Octobre de 17h à 21h * Formation "Administrateur de Site EGEE" au CC les 24 et 25 octobre * La prochaine visio/télé-conférence est le mardi 25 septembre 2007 ##################################################################### *********** * Réunion * *********** 0) Liste de présence / site : ------------------------ - Absents annoncés : - CC.IN2P3.FR (2) Pierre Girard Pierre-Emmanuel Brinette - CGG.COM (1) Jean-Bernard Favreau - CLERMONT.IN2P3.FR (2) Emmanuel Medernach Jean-Claude Chevaleyre - CPPM.IN2P3.FR (2) Edith Knoops Thierry Mouthuy - DAPNIA.CEA.FR (2) Frédéric Schaer Zoulikha Georgette - IBCP.FR (0) - IPNL Lyon (3) Denis Pugnere Guillaume Baulieu Yoan Giraud - IPSL / IPGP (1) David Weissenbach - IRES.IN2P3.FR (0) - LAL.IN2P3.FR (2) Guillaume Philippon Michel Jouvin - LAPP.IN2P3.FR (2) Eric Fede Muriel Gougerot - LPNHE.IN2P3.FR (0) - LPSC.IN2P3.FR(0) - SUBATECH.IN2P3.FR (0) Total: 17 personnes 1) Approbation du compte-rendu de la dernière visioconférence (tous, 5') ---------------------------------------------------------- http://indico.in2p3.fr/materialDisplay.py?materialId=minutes&confId=315 Compte rendu approuvé, pas de commentaires. 2) Tour des sites (tous, 25') -------------- * Sujets particuliers : ******************* - Pool of accounts pour SGM et PRD Question d'Eric (LAPP) sur l'utilisation des pool accounts pour les rôles Production et Software Manager posée lors de la dernière visioconférence. -> Pierre (CC) a transmis la question au " WLCG Operation Meeting". -> La réponse est : "Il faut utiliser les pool accounts pour SGM et PRD sauf si la VO ID Card du CIC portal précise explicitement que la VO ne veux pas utiliser ce mécanisme." Michel (LAL Orsay) : Concernant Quattor. - Les pool account on été demandés pour des raisons de sécurité (possibilité de tracer les utilisateurs de productions). -> Les taches d'administration sont alourdies, il faut repasser la configuration à la main. -> Les Pool Acounts pour les Roles SGM et PRD ne seront pas implémentés pour le moment dans Quattor Eric (LAPP) : - Les sites peuvent-ils choisir de passer ou non au pool account ? - Pierre (CC) : Il faut revenir sur le sujet et proposer que ce soit les VOs qui choisissent explicitement d'utiliser ce mécanisme, et que par défaut, elles utilisent un seul compte pour les rôles SGM et PRD. David (IPSL) : - Il y a des différences de fonctionnalité pour les rôles SGM suivant les VOs du fait du changement de groupe. Le répertoire Software Area doit etre en lecture pour tout le monde ce qui pose des problèmes à certaines VOs qui ne veulent pas que leurs programmes soient accessibles aux autres VOs. Frederic Schaer (DAPNIA) : - Les VOs ne se manifestent pas concernant cette question. D'une manière générale, elles ne se manifestent pas tant qu'il n'y a pas de problèmes. Michel (LAL Orsay) : Les VOs ne sont pas intéressés par la fonctionnalité. - Reaction : de nombreux tickets GGUS ouvert car elles n'arrivent pas écrire dans le Software Area. - Les VOs LHC ont particulièrement remonté de problèmes suite au passage au pool account. Particulierement LHCb -> Pierre (CC): Fournir le maximum d'infos (tickets) afin de les faire remonter. Pierre (CC) : La recommandation officielle de SA1 est de passer au pool account. - Ce n'est qu'une recommandation - Il faut essayer d'inverser la tendance. -> Remonter l'info au ROC Manager - Point Positif : SA1 pousse l'utilisation du CIC Portal comme référentiel pour les informations des VOs (VO ID Card) Michel (LAL Orsay) : - La politique des sites peut etre ne pas passer au pool acounts tant qu'on ne leur demande pas. - Ticket GGUS: Bravo, c'est à peu près à jour !!!! https://gus.fzk.de/ws/ticket_search.php?supportunit=ROC_France&status=open&radiotf=1&timeframe=no Pas de PB particulier. Pierre (CC) a fait du ménage dans d'anciens tickets résolus (utilisateur n'ayant pas répondu) et le TPM à fait de même. -> Résultat plutôt bon. - CC-IN2P3 ******** * 18 septembre : Opération de maintenance générale sur le site (réseaux, service, …): Un Scheduled Downtime complet est posé pour la journée. Le serveur VOMS hébergé au CC (biomed) sera lui aussi arrêté. Le redémarrage est prévu dès que possible dans l'après midi / début de soirée. * TOP BDII Régional: Le top BDII sera basculé vers celui du LAL pour le 17 septembre. * Les Classic SE sont sortis de production. La migration vers dcache est très lente (dû à PNFS et à la Bdd PgSql). Le transfert des données durera 2 semaines. - CPPM Marseille ************** * Nouveauté : RAS * Problèmes : RAS - LPC Clermont ************ * Nouveautés : Préparation d'un nouveau site EGEE de 30 machines dédiés à auvergrid et biomed. * Problèmes : Le Site BDII est HS depuis ce matin. La publication du site est incomplète. - CGG Massy ********* * Problèmes liés au pool account des roles SGM et PRD : * PB d'écriture pour LHCB dans le Software Area et qui entraîne une désynchronisation du soft installé. * Ticket émit pour faire modifier une fonction de yaim qui effectue un chmod sur les Workers Nodes. -> Pierre (CC) : Faire suivre le ticket pour remonter au ROC - IPSL Paris ********** DAVID : PB : Le Software Area est plein par LHCB. Il n'y a pas de tickets GGUS en cours. - Solution, migrer vers plus de disque et contacter l'utilisateur. - Reflexion : Aucune recommandation n'est faite concernant les besoins des VOs pour les Software Area, comment par exemple gérer les quotas ? Pierre (CC): Ca rejoint le problèmes de pool account. Comment un site peut annoncer au VOs la configuration installée. Il manque un moyen de publier ce type d'info. Michel (LAL Orsay): - Il faut demander à ce que les recommandations soient publiés dans les VO ID Cards. - Au LAL le Software Area est passé de 70 Go à 250 Go. --> Pierre (CC) fera remonter ces infos à Rolph. Pierre (CC) > Frederic Schaer (DAPNIA) : Y a-t-il quelque chose de prévu concernant les Software Area dans le Vo ID cards? Frederic : Rien pour le moment. - LAPP Annecy *********** * Nouveauté : - Migration d'un SE sous Quattor - Utilisation du soft DPM pour effectuer le changement du hostname dans la BDD de DPM - Une upgrade matérielle (disque et CPU) est prévue - Durant l'été, plusieurs WN SL4/64 bits on été mis en tests, aucun problème n'a été remonté par des utilisateurs.. En attente de la release officiel pour une mise en production. - LPSC Grenoble ************* Absent mais a donné des informations par mail * Nouveauté : - Actuellement en phase d'achat de stockage pour 24 To. - GRIF Ile de France ****************** * CEA Saclay Sur l'installation de WN 64 bits ,Il a des problèmes de "kernel panic" liés au Kernel et/ou aux modules installé via RPM non encore résolu. -> Eric (LAPP )propose une solution ... * IPN Orsay * LAL Orsay Problèmes : - Problèmes de transfert avec le CC et Clermont suite a la mise à jour du glue schema 1.3 - Il semblerait qu'il y ai un problème avec le CIC lors de l'utilisation de la SAM admin page. -> Pierre (CC): Ce problème peut venir de la version LCG UI utilisée. Vérifier avec le CIC s'il ne faut pas redémarrer le service. - Pour Quattor, problème avec le package Disk Server DPM 3.1. Le problème impacte les sites qui utilisent des firewall en amont de leurs serveur. La syntaxe décrivant les port Globus (Globus port range) a changé, et n'était plus pris en compte à l'installation. Ce problème est en cours de correction. Concernant le Tutorial Egee (8/9 octobre) organisé au LAL. Il manque des intervenants pour faire des présentations. -> programme transféré sur la liste SA1-FR * LPNHE * LLR Quelques problèmes avec DPM sur SL4.3 lié à la version de openldap et du Glue Schema. Un lien réseau à été commissionné entre le GRIF (T2) et le T1 pour CMS. Activité réseau importante en cours. * APC - SUBATECH Nantes *************** Absent - IRES Strasbourg *************** Absent - IPNL Lyon ********* * Nouveauté : - Alice a installé leur soft sur le site fin de semaine dernière. Ils vont commencer leur activité très prochainement. * Problème : - Un CE est tombé au cours de la nuit. La charge du serveur a augmenté jusqu'à 800 processus -> Reboot nécessaire. 3) Tour des VOs (5') ------------ Michel propose d'inviter Nelli ou Ghita pour parler des problèmes de Vos. Pierre (CC): Va proposer au intéressé de participer à la Reunion. - AUVERGRID Comme vu plus haut, 1 site a été rajouté. Sinon RAS - BIOMED Data Chalenge imminent. Le CPPM constate beaucoup de jobs en cours sur leur site. - DZERO RAS - EGEODE Dès que le cluster MPI de la CGG sera prêt, ils pourront tester les jobs parallèles sur le site. - EMBRACE RAS - ESR - Phase de production importante sur l'IPSL. Il n'y a pas de problème particulier à part le fait que l'immense majorité des calculs ne sont pas pris en compte par l'accounting, juste le VO time. A priori, les jobs effectuent un double fork et changement d'utilisateur. PBS ne prend pas correctement en compte le temps réel de calcul. - Pas de rapport avec la VO permettant de rentrer en contact avec les utilisateurs. - Les utilisateurs qui soumettent ce type de jobs sont à Marseille Edith (CPPM) : Ces utilisateurs sont hébergés au CPPM. Leur responsable est actuellement en Chine pour trois mois. -> Edith fera remonter les informations aux intéressés. Michel : Quoi qu'il arrive, ce type de job est non-conforme avec le User Policy des Vos. - FUSION RAS 4) Ateliers "Sécurité" et "Batch System" (Tous, 10') ------------------------------------- Pierre (CC) : Les pages d'inscription et agendas préliminaires accessibles depuis: http://egee.in2p3.fr/events/ Les scripts PHP des formulaires d'inscription viennent juste d'être mis en place. Gilles étant en mission, le déploiement a été effectué par Pierre. Il est possible qu'il y ait des erreurs auxquels cas, les remonter. Agendas préliminaires. - Atelier Sécurité : Envoyer des mails à Hélène. Eventuellement prévoir une conférence téléphonique avec 3 ou 4 personnes pour affiner les thèmes. - Atelier Batch System : Envoyer des questions ou remarques à Eric. Le CC mettra à disposition des machines virtuelles, par contre avec une mémoire RAM limitée. Eric: L'agenda doit être mis à jour : mettre 2 ou 3 points généraux. 5) Compte-Rendu LCG-France (Frédérique, 5') ----------------------- 6) Réunions/Conférences (5') -------------------- - passées ******* * CHEP du 2 au 7 septembre à , Victoria, Canada http://www.chep2007.com/ Michel à participé à la conférence et fera suivre les liens intéressant sur SA1FR. Présentations intéressantes : - Grid tools : glexec - Atlas a fait des tests grandeurs natures (depuis la production de données des détecteurs jusqu'à l'analyse dans les Tier 2). Les tests on été très satisfaisants et prouvent la viabilité de la grille. * GDB Meeting, le 31 aout, à TRIUMF http://indico.cern.ch/conferenceDisplay.py?confId=8487 * WLCG-OSG-EGEE Operations meeting, du 10 septembre http://indico.cern.ch/conferenceDisplay.py?confId=20374 - à venir ******* * LCG-France T2-T3 Technical meeting du 14 septembre 2007 http://indico.in2p3.fr/conferenceDisplay.py?confId=360 * WLCG-OSG-EGEE Operations meeting, du 17 septembre http://indico.cern.ch/conferenceDisplay.py?confId=20895 * ROC managers phone conference, du 18 septembre http://indico.cern.ch/conferenceDisplay.py?confId=14080 7) Divers (5') ------ * Confirmation d'une session EGEE France à la conférence EGEE07 : slot réservé le mardi 2 Octobre de 17h à 21h * Formation "Administrateur de Site EGEE" au CC les 24 et 25 octobre * La prochaine visio/télé-conférence est normalement prévu le mardi 25 septembre 2007. Cependant, il est possible qu'une reunion SA1 se tiennent durant --> A confirmer si SA1-FR se tient à EGEE 07. Fin: 15:15