visioconférence du groupe SA1-FR d'EGEE ======================================= Date : Mardi 21 septembre 2004, 14h Présidé par : Rolf Rumler (CC-IN2P3) Secrétaire : Pierre Girard (CC-IN2P3) Ordre du jour : *************** 1) Approbation du compte-rendu de la dernière visioconférence (tous) - http://agenda.in2p3.fr//askArchive.php? base=agenda&categ=a0421&id=a0421/moreinfo 2) Tour des sites - CC-IN2P3 - CPPM Marseille - LPC Clermont - LAL Orsay - CEA Saclay - CGG - IPSL - Ecole Centrale Paris - CINES 3) Formation des utilisateurs ("sondage") (tous) 4) VO ESR (Pierre) 5) Exploitation façon EGEE (Rolf, Hélène) (Il y a une demande du CERN de basculer de la structure LCG vers celle d'EGEE en ce qui concerne l'exploitation à partir du 1er Octobre). 6) Réunions - passées * All activity meeting le 13/9 au CERN (Rolf), voir http://agenda.cern.ch/fullAgenda.php?ida=a043604 * CIC meeting le 13/9 au CERN (Rolf) * NA4/SA1 working group le 15/9 au CERN (Rolf et/ou Yannick Legré) * téléconférence ROC managers le 21/9/2004, 11h (Rolf) - à venir * téléconférence CIC managers le 22/9/2004, 11h. * All ROC managers meeting à Bologne (Italie) le 5/10/2004. CHANGEMENT DE DATE: * visioconférence SA1-FR le 12/10/2004, 14h (au lieu du 5/10) 7) Divers Réunion : ********* 0) Liste de présence / site : ------------------------ - Absents annoncés : 0 - CC.IN2P3.FR (5) Gilles Mathieu Helene Cordier Jonathan Schaeffer Pierre Girard Rolf Rumler - CGG.COM (4) Ahmed Beriache Gael Youinou Gerard Gadaud Stephane Fintz - CINES (1) Nicole Audiffren - CLERMONT.IN2P3.FR (4) Emmanuel Medernach Jean Salzemann Jean-Claude Chevaleyre Yannick Legre - CPPM.IN2P3.FR (1) Edith Knoops - DAPNIA.CEA.FR (2) Pierrick Micout Zoulikha GEORGETTE - IBCP.FR (2) Christophe Blanchet Vincent Lefort - IPSL / IPGP (1) Cathy Boonne - LAL.IN2P3.FR (1) Charles Loomis Total: 21 personnes 1) Approbation du compte-rendu de la dernière visioconférence (tous) ---------------------------------------------------------- - http://agenda.in2p3.fr//askArchive.php? base=agenda&categ=a0421&id=a0421/moreinfo Approuvé 2) Tour des sites -------------- - CC-IN2P3 ******** Upgrade du site en 2.2.0 et ajout de disques (~600 Go au total) sur notre SE de disque. La mise à jour du site a été assez longue à cause d'opérations de copie de disque qui ont pris pas loin de 14h, et aussi de problème d'informations incohérentes publiées par l'information provider de notre CE. Le temps de régler les problèmes, nous sommes restés fermé du lundi 14h au jeudi 17h. Concernant les autres services : - RLS/RMC pour la vo Biomed: * Installation en 2 phases : test (schéma classique Tomcat+MySQL sur la même machine), production (DB délocalisée et gérée par le département "base de données" du CC pour garantir les backup et la maintenance) * Etat d'avancement phase 1: La machine a été mise à disposition, les rpms installés, reste donc la partie configuration * Pierre ayant une surcharge de travail et devenant bloquant, il assure le suivi, mais a effectué un passage du dossier à David Bouvet (david.bouvet@in2p3.fr). Yannick annonce la mise en place d'un RLS/RMC de test en italie pour la VO Biomed. Yannick informera les membres de la VO Biomed qu'ils peuvent effectuer des tests sur ce RLS/RMC. - le RB est devenu une priorité moins importante, puisque la VO Biomed a maintenant plusieurs RBs possibles. - CPPM Marseille ************** Rien de nouveau, pas de machines car pas de commandes. Actuellement, la totalité du temps a été consacrée à l'écriture de papiers. Concernant la visite du CPPM au CINES, ces derniers sont intéressés mais n'en sont qu'à la phase initiale encore. - LPC Clermont ************ Installations de WNs (30 de plus), quelques soucis. Installation d'un nouveau CE. La version actuelle du site est la Version 2.2.0 - LAL Orsay ********* Une UI qui est déjà utilisée. Les autres ressources sont installées avec Quattor. Presque toutes sont testées mais manque de temps pour finir. A la demande de tous, Cal devrait fournir un lien sur son travail avec Quattor. ce qui permettra aux RCs de commencer eux-mêmes à tester Quattor en partant de l'expérience de Cal. - CEA Saclay ********** Une deuxième machine. En contact avec CAL pour l'installation avec Quattor. Q: Est-ce que qq'un sait qq chose sur l'utilisation de quattor par le CERN ? R(CAL): pour l'instant rien de particulier. - CGG *** Connectés en télé-conf, car panne de visio-conf. La réception de certains jobs (principalement VO LCHB) provoque des "Out of memory" sur les machines. Q (CGG): Y a-t-il des recommendations pour les WNs. R: Il y a un document de Markus Schulz qui a circulé sur les recommendations hardware, et on peut trouver son contenu sur le site EGEE France : https://egee.in2p3.fr/html/Private/index.php?page=Documentation/doc-interface/viewdocs.php&topic=7 On remarque aussi un fort taux d'échec des jobs soumis. Yannick précise qu'il est reconnu que: - les jobs de physique ont un taux bas d'échec. - les jobs non-HEP ont un taux élévé d'échec. Ca peut dépendre aussi de ce qui est installé sur les RCs sur lesquels sont soumis les jobs. Par exemple, l'emploi de librairies particulières qui ne seraient pas installées de base sur la version LCG-2. Sinon, à venir sur le site de CGG: - Cluster de 128 Processeurs. - Etudier la façon de gérer l'utilisation des ressources CGG pour CGG et l'utilisation pour EGEE. - IPSL **** David est à Karlsruhe. Actuellement: une UI, un CE, un SE, 3 WNs Tous les jobs soumis depuis l'UI reviennent "aborted". La soumission se fait en dteam, et le job est un HelloWorld-like. Puisque c'est des jobs sur la VO dteam, yannick suggère de contacter maria.dimou@cern.ch pour lui parler de ce problème. - Ecole Centrale Paris ******************** Absent - CINES ***** Rien de commencer encore. Pour l'instant, le CINES a effectué un travail plutôt côté NA4, sur les applicatifs. La prochaine phase est l'installation de LCG-2 3) Formation des utilisateurs ("sondage") (tous) -------------------------- Il faudrait connaître le nombre des utilisateurs intéressés par une formation sur l'utilisation de la grille. Q(CGG): Agenda ? Le nb de jours ? R(Rolf): On ne connaît pas les détails. On cherche à savoir qui vient pour savoir où et comment l'organiser? Les réponses au nombre de personnes sont : - CPPM: inconnu - LPC: Une dizaine de personnes intéressées - LAL: 2 personnes - CEA: 2 personnes - CGG: 0 Personnes. En attente de la VO ESI. - IPSL: au moins 4. - CINES: un peu prématuré. Il y a déjà 2 personnes qui doivent aller au tutorial à Madrid. Rolf: vu le nombre, on va s'orienter vers une formation au CC. On publiera l'info, et il est probable que ce soit début novembre après le NA3 Open Meeting. Pour rappel, le NA3 est chargé des aspects formation, et la France ne compte pas de membre de cette activité. 4) VO ESR (Pierre) ------ Nous avons reçu les informations pour déployer cette nouvelle VO sur notre site. Ce sera fait dès que possible. Si d'autres sites veulent supporter cette VO, Pierre peut leur fournir les informations. Sinon, Ron Trompert de SARA nous a fourni des scripts qu'ils ont mis au point pour ajouter des VOs à partir des configurations LCFGng. Si des personnes sont intéressés, voici le lien : http://winnetou.matrix.sara.nl/grid-deployment/vofiles 5) Exploitation façon EGEE (Rolf, Hélène) ----------------------- (Il y a une demande du CERN de basculer de la structure LCG vers celle d'EGEE en ce qui concerne l'exploitation à partir du 1er Octobre). L'idée serait d'effectuer un roulement de la responsabilité, en l'affectant à un des 4 CICs pendant une période d'1 semaine. Par contre, pour l'instant, on n'a pas beaucoup de précision sur ce que le CIC doit faire. Ce qu'il faut savoir, c'est qu'à partir de maintenant, le CIC responsable peut être amené à contacter n'importe lequel des sites pour signaler des problèmes détectés sur le site incriminé. Il devrait y avoir un système de traitement d'incidents. Mais, dans la pratique, nous ne sommes pas assez avancés sur GGUs pour l'utiliser dans ce cadre-là. Donc, en attendant, on va basculer sur Savannah. L'un des pbs actuels est qu'il y a très peu d'outils de communication pour les sites CICs entre eux et avec les autres. C'est pour cette raison que le CC a commencé à travailler sur un site web CIC. L'idée du site serait d'être un point d'entrée unique pour traiter les aspects opérationnels avec tous les types d'acteurs d'EGEE impliqués dans la production. Ce serait donc un outil de travail pour gérer la collaboration entre l'activité SA1 et tous les intervenants au niveau opérationnel. Le CC travaille sur une maquette. Dès qu'on aura quelque chose qu'on peut présenter on vous communiquera le lien sur la liste. A savoir néanmoins, c'est une initiative du CC, entreprise sans accord préalable avec les autres CICs. L'idée étant de montrer ainsi aux autres CICs (entre autres) ce qu'on pourrait avoir. Des questions ? Des idées à ce propos ? N'hésitez pas à en parler sur la liste de diffusion. 6) Réunions -------- - passées ======= * All activity meeting le 13/9 au CERN (Rolf) ************************************ voir http://agenda.cern.ch/fullAgenda.php?ida=a043604 Les TSs reviennent !! Le changement: le CERN a mis en place un outil de suivi de projet au CERN. On peut donc saisir ses informations de TS sur le site. En théorie, on devrait le faire individuellement, mais dans la pratique, il a été établi qu'un superviseur devrait aussi pouvoir le faire pour d'autres. Donc actuellement, nous devrions déjà l'utiliser. Mais, puisque le système est en cours de modification (implémentation des extra-rights du superviseur), mieux vaut attendre une bonne semaine avant de commencer à l'utiliser. * CIC meeting le 13/9 au CERN (Rolf) *************************** Réunion focalisée sur le problème du basculement de l'exploitation façon LCG vers l'exploitation façon EGEE * NA4/SA1 working group le 15/9 au CERN (Rolf et/ou Yannick Legré) ************************************* Ce groupe doit traiter les questions de collaboration entre NA4 et SA1. Ce groupe a pour but de formuler des recommendations au PEB. Il est apparu pendant cette réunion que certains RCs ne voulaient pas offrir des ressources à des VOs dont le domaine d'application n'est pas en relation avec le leur. Il y aura bientôt la publication du CR, il circule déjà sous forme de draft pour correction et commentaire. * téléconférence ROC managers le 21/9/2004, 11h (Rolf) **************************************** La communication était si difficile (pbs techniques) que peu de points ont pu être débattus. Néanmoins, le sujet des TSs a été abordé et il y a des documents intéressants sur le sujet, consultables via l'agenda: http://agenda.cern.ch/fullAgenda.php?ida=a043655 - à venir ======= * téléconférence CIC managers le 22/9/2004, 11h. **************************************** On va parler de la façon d'organiser le suivi de pbs d'exploitation entre les CICs. * All ROC managers meeting à Bologne (Italie) le 5/10/2004. ********************************** Rolf, Hélène et Pierre y seront. CHANGEMENT DE DATE: ****************** En raison du meeting à Bologne, la prochaine visio-conférence est repoussée: * visioconférence SA1-FR le 12/10/2004, 14h (au lieu du 5/10) 7) Divers ------ Le point sur l'état d'avancement de la mise en place du service RLS/RMC au CC, demandé par Christophe Blanchet, a été traité dans la section 2). Heure de fin de la réunion: 14:55