visioconférence du groupe SA1-FR d'EGEE ======================================= Date : Mardi 30 novembre 2004, 14h Présidé par : Rolf Rumler (CC-IN2P3) Secrétaire : Pierre Girard (CC-IN2P3) * Ordre du jour : *************** 1) Approbation du compte-rendu de la dernière visioconférence (tous) - http://agenda.in2p3.fr//askArchive.php?base=agenda&categ=a0427&id=a0427/minutes 2) Tour des sites - CC-IN2P3 - CPPM Marseille - LPC Clermont - LAL Orsay - CEA Saclay - CGG - IPSL - LAPP - Ecole Centrale Paris - CINES 3) Tour des VOs - Biomed - D0 - EGEODE - ESR 4) Procédure d'enregistrement des sites (Pierre, Rolf) 5) Réunions - passées * 2e Conférence EGEE à La Haye, 22 au 26 novembre (Rolf) * GDA meeting (EGEE operations), 29 novembre (Frédéric) * ROC managers meeting, 30 novembre, 11h (Rolf) - à venir * OSG Grid Operations Workshop, Indiana/US, 1er au 3 décembre * visioconférence SA1-FR le 14/12/2004, 14h 6) Divers * Réunion : ********* 0) Liste de présence / site : ------------------------ - Absents annoncés : Fabio Hernandez (vacances jusqu'au 15/01/05), Vincent Lefort, Christophe Blanchet, Yannick Legré (tutoriel "Advanced LCG-2" au CERN) - CC.IN2P3.FR (5) Frederic Schaer Gilles Mathieu Jonathan Schaeffer Pierre Girard Rolf Rumler - CGG.COM (5) Ahmed Beriache Gael Youinou Gerald Vetois Gerard Gadaud Stephane Fintz - CINES (2) Nicole Audiffren Gérard Giles - CLERMONT.IN2P3.FR (5) Dominique Bonnet Emmanuel Medernach Jean Salzemann Jean-Claude Chevaleyre Pierre Reichstadt - CPPM.IN2P3.FR (2) Edith Knoops Eric Fede - DAPNIA.CEA.FR (1) Zoulikha Georgette - IBCP.FR (0) - IPSL / IPGP (2) David Weissenbach Geneviève Moguilny - LAL.IN2P3.FR (1) Daniel Jouvenot - LAPP.IN2P3.FR (2) Frederique Chollet Le Flour Muriel Gougerot Total: 24 personnes 1) Approbation du compte-rendu de la dernière visioconférence (tous) ---------------------------------------------------------- - http://agenda.in2p3.fr//askArchive.php?base=agenda&categ=a0427&id=a0427/minutes Approuvé 2) Tour des sites -------------- - CC-IN2P3 ******** Consolidation du système de publication d'information du site: upgrade du Generic Information Provider du GIIS et mise en place en parallèle d'un BDII utilisé comme GIIS. L'intégration de la VO Dzero est devenue opérationnelle. Un problème au niveau de la GOC databasse: nous avons hérité de l'opération de maintenance de l'IN2P3-LPC. - CPPM Marseille ************** Le cluster est installé depuis ce matin. L'installation a été faite à l'aide de Quattor. C'est la prochaine release de LCG Le batch system est PBS. Contact accounting: Edith - LPC Clermont ************ Le CE qui s'essoufflait a été remplacé avec succès. Depuis, l'accès au site s'est notablement amélioré. Pour l'instant, aucun travail sur l'accounting n'a pu être entrepris, mais Frédéric sera contacté prochainement à ce sujet. Comme le CC, le LPC hérite des opérations de maintenance du CC sur la GOC DB. - LAL Orsay ********* Rien de spécial. - CEA Saclay ********** Le Dapnia est enregistré comme site LCG-2 et attend l'arrivée de 8 machines (mono-pro), probablement dans 15 jours. L'installation prévue est en RH 7.3 via Quattor En attendant, des tests des fonctionnalités de la grille sont entrepris depuis une UI de Lyon. Frédéric: Attention, lors du GDA de lundi après-midi, il a été recommandé de prévoir 2 CEs si l'on souhaite gérer à la fois des WNs en RH7.3 et SL3. - CGG *** Actuellement, des tests du MPI sont en cours. Ahmed: des problèmes concernant les services RGMA ont été signalés. Apparemment, il n'y a pas de services derrière le port 8088. Eric: ce port correspond surement au service tomcat sécurisé (avec certificat). Concernant ce problème, Fred se propose de regarder. Q: est-ce que d'autres sites testent TORQUE/MAUI ? R: Sur Clermont c'est utilisé pour le scheduler. Le reste tourne toujours sous pbs. Q: Ne faut-il pas harmoniser tous les sites et utiliser le même scheduler ? R: Non, l'esprit grille est de permettre d'utiliser le système que chaque site souhaite. Indication de Rolf concernant TORQUE/MAUI: à Nikhef, Davide Salomoni utilise ce scheduler depuis longtemps. Il peut donc être une source d'information importante. - IPSL **** Installation du 4ième WN: P4 2Ghz. Pour diminuer la charge du CE, David a augmenté le délai de mise à jour du RGMA service status (2mn30). Mise en garde de Frédéric: si l'update est de + de 10mn, le RGMA est déclaré comme non fonctionnel. Le programme pour les 15 prochains jours: - mise en place de l'accounting, - intégration de la VO EGEODE, - pour faire plaisir à Pierre, travail sur le scheduler PBS pour la gestion des priorités, éventuellement en utilisant MAUI. Concernant l'intégration de la VO EGEODE sur le site de l'IPSL, la CGG se propose de passer pour l'aider à l'intégration et discuter de ce qu'ils souhaitent faire comme essais. Geneviève teste actuellement le MPI avec le compilateur F90 qui s'avère efficace à la compilation, mais un peu moins à l'exécution. - LAPP **** Configuration du RB pour accepter la VO Biomed. Frédérique a du chercher par elle-même les différentes informations de configuration nécessaire pour son BDII. Pierre lui suggère pour récupérer ces informations de consulter la configuration du BDII du CNAF publiée à l'URI: http://grid-it.cnaf.infn.it/fileadmin/bdii/egee-bdii-update.conf - Ecole Centrale Paris ******************** Pas de nouvelles. - CINES ***** Attente du matériel définitif. En attendant, les anciennes machines ont été installées et commencent à être opérationnelles en interne. L'installation a été effectué via LCFGng. Le site deviendra officiel lorsque les nouvelles machines seront arrivées. L'installation complète du site est prévue pour début 2005. En plus des nouvelles machines, et une fois l'installation maitrisée avec ces dernières, il est prévu d'intégrer une ferme de machines HP de 16 Noeuds Bi-pro XEON. 3) Tour des VOs ------------ - Général ******* Le CE intégrera prochainement à son site les VOs EGEODE et ESR. - Biomed ****** Rien. (Yannick étant absent, sinon... ) - D0 ** Une spécificité de cette VO: l'exécution des jobs s'opère sans pré-installation d'application. Les jobs vont récupérer sur un SE les softs, les placent dans le scracth du WNs et les exécutent. A la fin du job, le batch system nettoie tout. Les personnes D0 peuvent soumettre des jobs en utilisant l'infrastructure de la grille LCG/EGEE. L'UI du centre est configurée pour ce faire. - EGEODE ****** Intégration dans le registrar aujourd'hui par Maria Dimou. Actuellement, des tests ont été menés pour soumettre des jobs plus légers puisqu'ils délèguent le linkage à un serveur distant dédié. Le CC va supporter la VO EGEODE. - ESR David est devenu Software Administrator. Actuellement, le centre d'intérêt de la VO est l'utilisation de certaines interfaces pour la gestion de méta-données (collaboration avec Nikhef et des confères allemands) Dans le même ordre d'idée, la VO s'intéresse au - Metadata Catalog de Peter Kuntz et des gens du CERN. - l'utilisation conjointe d'un Metadatacatalog et de VOMS. Le CC va supporter la VO ESR. 4) Procédure d'enregistrement des sites (Pierre, Rolf) ------------------------------------ Le groupe sécurité veulent que les nouveaux sites fournissent un formulaire avec diverses informations, notamment les horaires où l'on peut contacter les administrateurs, le nom et le No de téléphone du contact Sécurité, etc. Les grandes lignes de cette proposition de procédure peuvent être consultées sur l'agenda de la conférence EGEE de La Haye. Il y a obligation de garder les logs de la machinerie LCG pendant 90 Jours pour pouvoir traiter les incidents de sécurité si besoin est. Le CC va se renseigner auprès de Ian Neilson pour savoir quels sont les fichiers de Logs concernés par cette procédure, notamment s'il est besoin de garder ceux des WNs aussi. Concernant les aspects "sécurité" au niveau EGEE, le groupe qui s'en occupe s'intéresse pour l'instant au problème en aval, c'est-à-dire une fois qu'un pb est détecté. Pour ce qui est du travail concernant la prévention, ce groupe ne fournit qu'un ensemble de docs. CGG: Y a-t-il un réseau au niveau France sur ce thème. R: Au niveau français, il y a un réseau sécurité. Au niveau de l'IN2P3, il y a aussi un réseau sécurité, distribué sur les différents sites de l'IN2P3, coordonné par une personne et un assistant. Ce dernier est Benoît Delaunay du CC, nous allons lui demander de participer à l'une des prochaines réunions pour parler des aspects "sécurité" au niveau France. 5) Réunions -------- - passées ******* * 2e Conférence EGEE à La Haye, 22 au 26 novembre (Rolf) Très peu de réunion sur le thème d'1 seule activité, et donc essentiellement des réunions multi-activités. Il y a eu de ce fait pas mal de décisions qui sont sortis de ces réunions. Pour les détails, voir les documents attachés à l'agenda de la conférence. Parmi les points importants qui ont été débattus : - Gros travail sur l'intégration d'une VO. - la VO NA4Test ne devrait finalement pas être mise en place. Une autre solution est en cours d'étude. * GDA meeting (EGEE operations), 29 novembre (Frédéric) Chaque lundi à 14h au CERN. Passage de la responsabilité d'exploitation (CIC on duty) du CC vers le CERN. 3 choses: - pb des mises à jour des CAs, apparemment ce pb n'en est plus vraiment un puisque la mise à jour a été effectuée par la plupart des sites. - pb de sécurité: lorsqu'un tel pb est détecté, comme ça été le cas cette semaine sur un site, il faut en informer la sécurité EGEE plutôt que LCG ROLLOUT. - La politique d'exploitation RGMA: pour mettre en service une MonBOX sur la grille, il faut envoyer un mail pour être accepté par le RAL. Frédéric va envoyer le mail qui a été diffusé sur LCG ROLLOUT à ce sujet. * ROC managers meeting, 30 novembre, 11h (Rolf) Annulé pour cause de grêve des bus à Rome. Reportée à demain. - à venir ******* * OSG Grid Operations Workshop, Indiana/US, 1er au 3 décembre Equivalent au Workshop du CERN. Il y a des personnes d'EGEE/LCG qui y participent, dont Hélène Cordier. * visioconférence SA1-FR le 14/12/2004, 14h Ensuite, la suivante serait le 04/01 janvier. 6) Divers ------ Fin: 15:03