visioconférence du groupe SA1-FR d'EGEE ======================================= Date : Mardi 15 juin 2004, 14h. Présidé par : Rolf Rumler (CC-IN2P3) Secrétaire : Pierre Girard (CC-IN2P3) * Ordre du jour : *************** 1) Approbation du compte-rendu de la dernière visioconférence (tous) Accessible à http://agenda.in2p3.fr//askArchive.php? base=agenda&categ=a0412&id=a0412/moreinfo 2) Avancement LCG-2 - CC (Nadia) - CGG - CINES - CPPM - ECP - LAL - LPC 3) Le point sur l'intégration de la VO Biomédicale (Pierre Girard) - Retour d'expérience sur l'intégration d'une nouvelle VO (Pierre) - Ressources actuelles de la VO : - Ressources à venir : • Recherche d'autres Ressource Centres pouvant supporter la VO • Replica Catalog au CC ? • Déploiement d'un CE avec PBS pour les jobs courts (Pierre) • Autres besoins ? 4) "Timesheets" (Rolf) 5) Réunions passées: - SA1 ROC Managers du matin (Rolf) - JRA1/SA1 au CERN, le 9/6/2004, 10h, voir http://agenda.cern.ch/fullAgenda.php?ida=a042304 - EGEE France au CC, le 11/6/2004, 9h30 à 17h, voir http://egee.in2p3.fr/events/meeting-2004-06-11/ 6) Réunions à venir: - LCG support meeting à Karlsruhe, le 15/06/2004, toute la journée (David) - EGEE All Activity meeting, le 18/6/2004, voir http://agenda.cern.ch/fullAgenda.php?ida=a042415 7) Divers * Réunion : ********* 0) Prologue ----------- News **** L'équipe GRID/EGEE du CC-IN2P3 s'agrandit avec l'arrivée de Fabien Wernli, qui intègre l'équipe des administrateurs système du CC et qui sera affecté à 100% au projet EGEE. Liste de présence / site : ************************ - Absents annoncés : * pour cause de réunion NA4 au CERN : Jean Salzemann, Yannick Legré, Christophe Blanchet * pour cause de réunion EGEE au CERN : Fabio Hernandez - CCIN2P3 Lyon (accès visio.) : 5 personnes Fabien Wernli Frederic Schaer Jonathan Schaeffer Pierre Girard Rolf Rumler - LPC Clermont (accès visio.) : 3 personnes Dominique Bonnet Jean-Claude Chevaleyre Thierry Mallet - CPPM Marseille (accès visio.) : 2 personnes Edith Knoops Eric Fede - CGG Massy (accès tél.) : 3 personnes Ahmed Beriache Gerald Vetois Gerard Gadaud - LAL Orsay (accès visio.) : 1 personne Charles Loomis - DAPNIA Saclay (accès visio.) : 1 personne Pierrick Micout - ECP Paris (absent) : 0 personne - IBCP (absent) : 0 personne - CREATIS (absent) : 0 personne Total réunion : 15 personnes 1) Approbation du compte-rendu de la dernière visioconférence (tous) ---------------------------------------------------------- Approuvé. 2) Avancement LCG-2 ---------------- * CC (Pierre/Rolf) ** Aujourd'hui, dans l'après-midi, le site de production va être rebooté pour : - intégrer 20 nouveaux Worker Nodes qui viennent s'ajouter au 3 existants. Nouveau total : 23 WNs - supporter la VO biomédicale La semaine dernière une nouvelle UI a été mise en service. La création de compte sur cette UI se fait via le site web EGEE SA1 France : http://egee.in2p3.fr/index.php?page=html/Public/userinterface.html La création de compte n'est possible que si l'utilisateur est déjà enregistré dans une VO de LCG-2. Autre nouveauté, le site LCG-2 du CC était jusqu'à présent complètement séparé du reste de l'infrastruture du CC. Maintenant, il est intégré à cette infrastructure, c'est-à-dire que la ferme LCG-2 est gérée par le même Master BQS que les autres fermes du centre. Q (Eric) : Qu'en est-il de la certification LCG-2 pour la production ? R (Rolf) : A notre connaissance, aucun site n'est encore sorti de la testzone. Mais beaucoup de sites font de la production en testzone. C'est le cas dès qu'ils sont validés par les VOs. La production s'effectue donc actuellement via les RB de la testzone. On ne connaît d'ailleurs pas de procédure officielle pour sortir de la testzone. * CGG *** Comme indiqué vendredi à la réunion EGEE France, le site est en cours de déploiement. A priori, en fin de semaine, ça devrait être installé. Il reste à résoudre le problème d'accès à internet. La configuration actuelle est : - 1 CE - 1 SE - 3 WNs bi-pros * CPPM **** Toujours au même stade : attente de machines. Si d'ici 1 semaine à 10 jours, la sistuation ne s'est pas débloquée, les machines utilisées pour Datagrid seront utilisées : - 3 machines pour les services - 4 WNs * LAL *** Toujours en attente de machines. * DAPNIA ****** Une machine Datagrid est réutilisée pour installer Quattor et faire des tests. * LPC *** Le site est toujours dans la testzone. A partir de jeudi, l'installation du stockage devrait démarrer. 3) Le point sur l'intégration de la VO Biomédicale (Pierre Girard) ----------------------------------------------- * Retour d'expérience sur l'intégration d'une nouvelle VO (Pierre) Une expérience selon 2 aspects : - le CC en tant que CIC : Il s'agit d'offrir le service de gestion de la base des utilisateurs. Ce service s'adresse donc au VO Manager et aux membres de la VO lors de leur enregistrement. La mise en place de ce service repose sur un serveur LDAP et sa configuration ne pose guère de problèmes. Par contre, la gestion d'une VO et les outils associés via cette solution sont assez frustres. Le système VOMS devrait par la suite apporter plus de confort. Enfin, le rôle du CIC est aussi de déclarer à travers EGEE l'intégration de cette nouvelle VO et donc de lui trouver : a) des centres de ressources prêts à l'accueillir b) un ou des Resource Brokers intégrant la VO et la liste des RCs l'accueillant c) un site pour héberger un service de Replica Catalog - le CC en tant que RC : Ce point intéressera les RCs qui souhaitent intégrer une nouvelle VO (comprendre une VO ne faisant pas partie de la distribution officielle de LCG-2). Actuellement, pour intégrer une nouvelle VO sur l'infrastructure LCG-2, il y a deux solutions : a) Installation manuelle : Elle demande une série de manipulations humaines sur les différents composants : création de l'espace de stockage, des comptes utilisateurs, modification des gridmapfiles (CE/SE), UI, etc. Cette solution est à envisager si on veut intégrer la VO sans avoir à arrêter le site, puisque LCFG ne semble pas prévu pour effectuer des mises à jour à chaud sans redémarrage. Elle est bien sûr source d'erreur et à refaire s'il y a reboot du site et que les modifications n'ont pas été reportées au niveau du serveur LCFG. b) Installation automatique avec LCFG : Hormis l'avantage de n'avoir à modifier les configurations que sur ce serveur, il faut savoir qu'il y a de nombreux fichiers de configuration à considérer. Pour la VO Biomédicale, Yannick et Nadia ont du tatonné pas mal et faire de nombreux tests avant d'arriver à une configuration de LCFG permettant un déploiement de LCG-2 intégrant la VO Biomédicale sur une infrastructure de test. Le déploiement officiel aura lieu aujourd'hui après reboot du site. Cette expérience a donc permis d'identifier l'ensemble des modifications à apporter et fera l'objet d'un document à disposition des RCs qui auraient à intégrer une nouvelle VO. La mise en place d'outils d'automatisation de la procédure de configuration de LCFG est aussi à l'étude. * Ressources actuelles de la VO : Le déploiement de LCG-2 d'aujourd'hui devrait offrir l'accès pour la VO Biomed à l'ensemble des resources du CC dédiées à LCG-2, soient 23 WNs Deux UI sont à dispositions des membres de cette VO : - l'UI avec création de comptes depuis le site EGEE. - l'UI pour ceux qui ont déjà des comptes AFS au CC. A la demande de Yannick (Legré), le CNAF a intégré la VO dans son Resource Broker Dès que le CC aura déployé et testé le support de la VO Biomed, il se déclarera auprès du CNAF comme RC supportant cette VO. * Ressources à venir : a) Recherche d'autres centre de resources pouvant supporter la VO Le problème de la recherche de RCs pour une nouvelle VO a fait l'objet d'une discussion ce matin lors de la réunion hebdomadaire des ROC Managers. Rolf en fait un résumé : Il faut distinguer le cas de deux types de VOs - les VOs régionales : le problème est géré régionalement, et n'est pas traité au niveau EGEE. - Les VOs EGEE : Pour l'instant, il n'y a pas encore de procédure définie dans EGEE. Elle reste à établir. L'OMC a la responsabilité d'organiser une enquête lors de la demande d'intégration d'une nouvelle VO afin d'établir la liste des resources susceptibles d'être allouées à cette VO. En se basant sur l'expérience de la VO Biomédicale, on va proposer une maquette pour la procédure d'introduction d'autres VOs. b) Replica Catalog au CC ? Le CC a reçu la demande officielle (Johan Montagnat) de support du Replica Catalog par le CC. Cette responsabilité incombe donc maintenant au CC. Pour ce qui est de la question des délais de mise en place, le CC doit d'abord collecter les informations qui permettront d'établir un calendrier des travaux. c) Déploiement d'un CE avec PBS pour les jobs courts (Pierre) L'une des tâches de Pierre GIRARD et Gilles MATTHIEU sera de déployer un nouveau CE au CC, avec PBS, dédié aux jobs courts, et ne supportant, au début, que la VO Biomédicale. Outre l'intérêt pour la VO Biomédicale, ce déploiement permettra - d'une part, à Pierre et Gilles d'acquérir aussi une expertise dans le déploiement de LCG-2 - d'autre part, de valider la procédure définie par Nadia et Yannick. Pour ce qui est des délais, ce déploiement ne devrait intervenir qu'après celui du Replica Catalog. d) Autres besoins ? Eric pense que les besoins essentiels sont couverts et donc que dans un premier temps, ça devrait aller. 4) "Timesheets" (Rolf) ------------ Actuellement, les TS à fournir sont ceux d'avril et de mai. Pour le mois d'avril, une seule tâche devrait suffir : SA1.1.1.4, Execution plan : induction to EGEE Sinon, lors de la réunion EGEE France, C. Lucas a donné de nombreuses indications sur les TS. Son exposé est consultable sur l'agenda : http://agenda.in2p3.fr//fullAgenda.php?ida=a0413 Pour le mois de mai, l'idée générale est : - toutes les tâches liées au déploiement LCG-2 correspondent à "Set-up of ROC". - toutes les tâches de gestion après déploiement correspondent à "operation and management of Roc". Pour les gens à la fois SA1 et autre chose, la problème se corse, et il y aura peut-être un souci avec leurs TSs. Hélas, nous n'avons pas d'infos pour ce cas. Ci-dessous à titre informatif, les indications que Rolf a transmis en interne au CC : *********** DEBUT mail de Rolf *********** Une partie de ce que j'ai envoyé aux "part timers" EGEE-SA1 du Centre: Résumé des activités définies: SA1.1.1.4 Execution Plan SA1.1.2.2 Setup of ROC SA1.1.3.3 Setup of CIC SA1.2.1.2 Operation and management of ROC SA1.2.2.3 Operation and management of CIC SA1.3 Operational Deliverables (à partir de janvier 2005 environ) Administration et tâches communes pour l'ensemble du projet EGEE: SA1.A.1 Activity management/Coordination SA1.A.2 Coordination with other projects SA1.A.3 EGEE conferences SA1.A.4 EGEE deliverable review SA1.A.5 Dissemination SA1.A.6 EGEE publications SA1.A.7 EU reviews SA1.A.8 Partner tasks SA1.A.9 Standardization bodies SA1.A.10 Training (trainee) SA1.A.11 Training (trainer) Tout ce qui est SA1.A.x (tâches communes) n'a normalement aucune importance pour nous. Sauf évidemmment si quelqu'un fait le "review" d'un deliverable pour EGEE, ou lors de la participation à la prochaine conférence EGEE à La Haye en Novembre. "Training" ne concerne que les formations "officielles" données dans le cadre d'EGEE, ce n'est donc pas une formation locale d'un centre de ressource pour quelqu'un fraîchement embauché. "Setup of ROC" inclût le demarrage d'un centre de ressource, avec tout ce qu'il y a: installation physique des machines, installation de LCG2 etc. "Operation and management of ROC" inclût l'exploitation normale d'un centre de ressource, une fois la phase initiale dépassée. La suite est plus compréhensible si vous ouvrez le fichier Excel du "timesheet": sur cette fiche cela donne par exemple: Sous "Activity", SA1; sous Tasks, "SA1.1.1.4"; sous "Task Title", "Execution Plan" (ou sous Tasks, "SA1.1.2.2"; sous "Task Title", "Setup of ROC"); sous "Work Performed", une déscription du travail fournit (en anglais). Pour avril, on peut choisir "Execution Plan" puis "Induction to EGEE". Pour le mois de mai, on pourrait typiquement choisir "SA1.1.2.2" puis "Task Title": "Setup of ROC". Il reste à trouver une déscription bref et général du travail fait sous "Work Performed". *********** FIN mail de Rolf *********** 5) Réunions passées: ---------------- - Réunion SA1 ROC Managers du matin (Rolf) Points abordés : * Obligations qui se greffent au dessus des TS : La constitution de l'execution plan de SA1. A ce propos, chaque site devra valider les informations qui les concernent : * la description des resources que chaque RC s'engage à dédier à EGEE à l'échéance de PM 15. Pierre fera circuler pour validation cette partie qu'il a remplie à partir des données indiquées dans sur le site EGEE SA1 France. * la listes des gens affectés à SA1 avec les noms de tous ceux qui sont SA1. Il faut signaler les changements. DAPNIA: Pierrick signale l'embauche de Christine Leroy à 100% sur SA1. * Première télé-conf du CIC mardi prochain à 14:00. Rolf sera donc absent à la réunion EGEE SA1 Fr de la semaine prochaine. * EGEE, All Activities Meeting ce vendredi au CERN qui permettra de faire un point sur chaque activité par leur responsable. * Discussion sur les mailing lists de SA1 : - une pour les ROC managers - une pour les CICs - une générale pour SA1, qui n'est pas utilisée actuellement, mais devrait servir pour signaler les pbs d'ordre général qui pourraient être résolus via se biais. Elle sera ouverte à tous les membres de SA1. - Réunion JRA1/SA1 au CERN, le 9/6/2004, 10h, voir http://agenda.cern.ch/fullAgenda.php?ida=a042304 Les plateformes à supporter : il n'y a plus de plateforme de référence (SURPRISE), mais un engagement de faire tourner EGEE sur le maximum de plateformes. Les développeurs se sont engagés à garantir la compatibilité du middleware avec la plateforme windows. - Réunion EGEE France au CC, le 11/6/2004, 9h30 à 17h, voir http://egee.in2p3.fr/events/meeting-2004-06-11/ 6) Réunions à venir: ---------------- - LCG support meeting à Karlsruhe, le 15/06/2004, toute la journée (David) - EGEE All Activity meeting, le 18/6/2004, voir http://agenda.cern.ch/fullAgenda.php?ida=a042415 7) Divers ------