visioconférence du groupe SA1-FR d'EGEE ======================================= Date : Mardi 30 Aout 2005, 14h Présidé par: Rolf Rumler (CC-IN2P3) Secrétaire: Pierre Girard (CC-IN2P3) ***************** * Ordre du jour * ***************** 1) Approbation du compte-rendu de la dernière visioconférence (tous) http://agenda.in2p3.fr//askArchive.php?base=agenda&categ=a0518&id=a0518/moreinfo 2) Tour des sites Sujets à traiter par site : * IMPORTANT: Validation de la planification des ressouces pour EGEE-II. Cf. mail de Fabio du 29/08 sur la liste SA1-Fr. * Update en LCG2.6.0 - CC-IN2P3 - CPPM Marseille - LPC Clermont - LAL Orsay - CEA Saclay - CGG - IPSL - LAPP - CINES - LPNHE 3) Tour des VOs - BIOMED * Retour d'expérience sur le Data Challenge : https://cic.in2p3.fr/index.php?id=vo&subid=vo_activity&js_status=2 - EGEODE * Testbed VOMS - ESR * Testbed VOMS 4) Gestion de la production en période de vacances (tous) 5) Réunions - passées * Téléconf GDA du mois d'aout. (Pierre) http://agenda.cern.ch/displayLevel.php?fid=258 - à venir * Téléconf ROC managers, le 06/09 http://agenda.cern.ch/fullAgenda.php?ida=a053513 * Téléconf CIC managers, le 08/09 http://agenda.cern.ch/fullAgenda.php?ida=a053583 * All Activity Meeting, le 13/09 au CERN http://agenda.cern.ch/fullAgenda.php?ida=a043604 6) Divers * Refonte du site CIC (Pierre) ##################################################################################### *********** * Réunion * *********** 0) Liste de présence / site : ------------------------ - Absents annoncés : - CC.IN2P3.FR (2) Pierre Girard Rolf Rumler - CGG.COM (5) Ahmed Beriache Florian Jierry Gael Youinou Gerald Vetois Gerard Gadaud - CINES (0) - CLERMONT.IN2P3.FR (1) Emmanuel Medernach - CPPM.IN2P3.FR (2) Edith Knoops Eric Fede - DAPNIA.CEA.FR (3) Christine Leroy Michel Winkler Zoulikha Georgette - IBCP.FR (0) - IPSL / IPGP (1) David Weissenbach - LAL.IN2P3.FR (1) Michel Jouvin - LAPP.IN2P3.FR (2) Frederique Chollet Le Flour Muriel Gougerot - LPNHE.IN2P3.FR (0) Total: 17 personnes 1) Approbation du compte-rendu de la dernière visioconférence (tous) ---------------------------------------------------------- http://agenda.in2p3.fr//askArchive.php?base=agenda&categ=a0518&id=a0518/moreinfo Approuvé. 2) Tour des sites -------------- Sujets à traiter par site : ************************* * IMPORTANT: Validation de la planification des ressouces pour EGEE-II. Cf. mail de Fabio du 29/08 sur la liste SA1-Fr. * Update en LCG2.6.0 - CC-IN2P3 ******** * Planification des ressources: OK Passage en LCG2.6.0 en cours de test. Mise en place d'une installation partagée via AFS pour les WNs. - CPPM Marseille ************** * Planification des ressources: OK Passage en LCG2.6.0 cette semaine ou la semaine prochaine. - LPC Clermont ************ * Planification des ressources: OK Passage en 2.6.0 dans le courant de la semaine prochaine. La semaine dernière, il y a eu un problème de remplissage des "home" (le GassCache) sur l'un des CEs. Apparemment, le gass_cache se remplissait au fur et à mesure de l'arrivée des jobs sans être nettoyé à la fin des jobs. Eric: Voir un thread de Jeff sur ce sujet (LCG-ROLLOUT). il soulevait le même genre de cas, et de mémoire, c'était un problème de date lors de la création des fichiers dans le Gass_Cache. - LAL Orsay ********* * Planification des ressources: Envoyé à Fabio ce midi, planification pour tout le T2 IDF Passage en 2.6.0 effectué. Les CAs ont été mises-a-jour avec des versions plus récentes que celles fournies par le projet EGEE/LCG. Du coup, les SFTs échouent. Les SFTs indiquent un problème sur l'accounting (apel ?), mais il semble que ce soit le test qui est faux pas l'installation. Pierre: ce sera rapporté à Frédéric Schaer pour qu'il regarde ce problème de SFTs et d'accounting. (FAIT) - CEA Saclay ********** * Planification des ressources: Envoyé à Fabio ce midi, planification pour tout le T2 IDF Toujours en LCG2.4.0, mais migration en LCG2.6.0 la semaine prochaine. - CGG *** * Planification des ressources: OK Passage en LCG2.6.0 la semaine prochaine. A cette occasion, il y aura update de l'OS en SL304. Durant les vacances, il y a eu un problème avec le BDII de la CCG (associé au RB). Il n'était pas rempli complètement. Des champs manquaient aux informations publiées, dont le SE du CERN. Du coup, les SFTs utilisant ce BDII (commandes lcg-*) étaient en échec. Le problème a été résolu en configurant le site de la CGG avec le BDII du LAL, qui est déjà en LCG2.6.0. - IPSL **** * Planification des ressources: Envoyé, mais avec une erreur, il fallait lire 3,9 et non pas 0,39 pour le KSI2000. Passage en LCG2.6.0, pour bientôt, mais pas encore de date fixée pour l'instant. - LAPP **** * Planification des ressources: OK Passage en LCG2.6.0 dans les 15 jours qui viennent. Concernant le problème de BDII de la CGG, au niveau du BDII du LAPP, il y a des messages d'erreurs qui laissent penser qu'il y a un problème de compatibilité entre différentes versions de glue schema, et donc entre les versions de LCG (LCG2.6.0 et ses précédentes). - CINES ***** * Planification des ressources: Nul Absent. - LPNHE ***** * Planification des ressources: Envoyé à Fabio ce midi, planification pour tout le T2 IDF Absent. Mais Christine fait la synthèse pour eux: - Passage en production bientôt. - Passage en LCG2.6.0 bientôt 3) Tour des VOs ------------ - BIOMED ****** * Retour d'expérience sur le Data Challenge : https://cic.in2p3.fr/index.php?id=vo&subid=vo_activity&js_status=2 Personne. - EGEODE ****** * Testbed VOMS Deux nouveaux utilisateurs intégrés à la base VOMS. Pour l'instant les tests fonctionnent avec un voms-proxy sans spécifier la VO. Par contre, ça ne fonctionne plus quand la VO est spécifiée. De plus, l'ajout de "roles" aux utilisateurs n'est toujours pas utilisé, car encore obscur. Il n'y a pas de documentation sur le sujet. Prochainement, la VO EGEODE devrait basculer sur une gestion via VOMS, et donc, pour tous les sites qui supportent la VO, il sera demandé de faire la configuration avec VOMS. Il faudra se demander si on doit upgrader le serveur VOMS pour passer de la version LCG à la version gLite. - ESR *** * Testbed VOMS Les tests en cours visent à définir des groupes et à tester la notion de "role", mais on n'a pas encore réussi à initier un voms-proxy avec un rôle. 4) Gestion de la production en période de vacances (tous) ----------------------------------------------- Durant l'été, il y a eu le cas de sites injoignables car tous les administrateurs étaient absents. Certains (ex. CEA-DAPNIA) ont simplement fermé le site, d'autres (IN2P3-LPC) étaient dans l'impossibilité de le faire car les ressources du site étaient en cours d'utilisation (Ex. DC Biomed). La semaine dernière, un CE de l'IN2P3-LPC a commencé à dysfonctionner. De nombreux jobs de la grille ont alors échoué sur ce CE. Comme le veut la procédure de production, le ROC Français a été alerté via un ticket GGUS, qu'il a affecté au site lui-même. Sans réponse du site, et après plusieurs rappels, le ROC a essayé de joindre le site par téléphone, sans plus de succès. Finalement, plusieurs jours après la première alerte, le ROC a posé un Downtime sur le CE incriminé de ce site dans la GOC DB. Cette dernière action doit avoir pour effet de supprimer cette entrée des BDIIs officiels de la grille EGEE, et donc de la production.. Actuellement, en dehors des sites administrateurs, seuls le ROC manager (Rolf) et le ROC deputy (Pierre) ont la possibilité de modifier les entrées des sites français dans la GOC DB. Ce qui implique qu'en l'abscence des admins d'un site et de ces 2 personnes, aucun downtime ne peut être mis sur le site. En conséquence, nous proposons les actions/procédures suivantes: - Pour le ROC: * demande d'extension de la liste du personnel ROC pouvant intervenir sur la GOC DB. - Pour les sites: * prévenir le ROC (grid-roc@cc.in2p3.fr) lors de l'absence exceptionnelle des administrateurs du site. * éventuellement, étendre la liste des contacts du site pour que le ROC puisse joindre qq'un au courant de la situation. La proposition est approuvée. 5) Réunions -------- - passées ******* * Téléconf GDA du mois d'aout. (Pierre) http://agenda.cern.ch/displayLevel.php?fid=258 A part le 15 aout, toutes les réunions GDA ont eu lieu pendant les vacances. A noter qu'un rapport sur l'état de GGUS a été présenté par Flavia Dono. Il fournissait les réponses aux questions qui avaient été adressée aux développeurs de GGUS concernant la stabilité de GGUS. Ces derniers ont indiqué qu'ils allaient mettre en place un système de réplication et un système de load balancing. GGUS devrait donc rester l'outil central du user support. Il a été aussi notifié que des contacts avec les US avaient été pris pour mettre en place un ROC US. La motivation première de cette démarche est de mettre en place un user support aux US. - à venir ******* * Téléconf ROC managers, le 06/09 http://agenda.cern.ch/fullAgenda.php?ida=a053513 * Téléconf CIC managers, le 08/09 http://agenda.cern.ch/fullAgenda.php?ida=a053583 * All Activity Meeting, le 13/09 au CERN http://agenda.cern.ch/fullAgenda.php?ida=a043604 * Operation Workshop, Abingdon, UK du 27 au 30 spetembre http://egee.in2p3.fr/events/UKI/ * 4ième conférence EGEE, du 24 au 28 octobre à Pise, Italie. http://public.eu-egee.org/conferences/4th/ * HEPIX, du 10 au 14 octobre au SLAC. - Prochaine visio-conférence le 20/09, puis tous les 15 jours ensuite. 6) Divers ------ * Refonte du site CIC (Pierre) Le site CIC connait actuellement une réorganisation profonde. Les sources de données qui alimentent le site sont réunies en un service qui les aggrègent et les uniformisent (en XML). Ce service est un Web service auquel on peut soumettre des requêtes XSL englobant l'ensemble des sources de données : GOC DB, Ticket GGUS, SFT, Système d'information de la grille (GIIS et BDII). Pour l'instant ce Web service sera utilisé en interne par le site web CIC, mais à termes son accès pourrait être ouvert à des partenaires externes. * Q(Eric): Concernant les pages d'accounting sur la GOC DB, il n'y a plus maintenant que l'accounting des VOs HEP. Est-ce normal ? Y a-t-il un autre moyen d'accéder aux pages d'accounting pour les VOs non-LHC ? R(David): le lien est toujours valide mais plus affiché. Ce lien a été envoyé dans la foulée sur la liste SA1-Fr. R(Pierre): la question sera soumise directement au GOC pour savoir le pourquoi du comment. Fin : 14:50