Réunion jointe Opération + AT Grille (Pierre)

Europe/Paris
322 (CCIN2P3)

322

CCIN2P3

Pierre Girard (CCIN2P3), Rolf Rumler (CNRS/IN2P3)
Description
Exceptionnellement seulement la première partie aura lieu: 1. Opération site CCIN2P3 Participants: représentants de l'exploitation, du support et d'autres selon ordre du jour, plus ceux de la réunion AT Grille habituelle. 2. AT Grille: cette partie est supprimée cette fois-ci.
    • Incidents et problèmes des VOs (CC, sites français, autres sites)
      • 1
        Sujets Exploitation:
        - réduction de puissance le 29/09 pour travaux dans le local onduleur (7 racks ont été arrêtés lundi matin). travaux finis vers 15h. - Arret du 30/09 * passage en SL4 du serveur ccsrm * arret HPSS : optimisation de la base, modification de la conf (+6 lecteurs T10K) * arret acsls : passage en version 7.3, configuration pour ajout des 6 lecteurs T10K. La sl8500 n'a pas pu être mise en production faute de pièces de raccord. * changement du switch réseau de 6 racks de workers 100Mb -> Gb - arrêt pour passage en SL4 64b de 6 racks de workers (3 IBM et 3 Dell). ils ne seront remis en prod qu'aujourd'hui car entre temps cms a remarqué un défaut d'installation sur les machines migrées semaine 39 : il manquait des librairies 32b. la correction est longue car il faut examiner tous les RPM un par un (1 journée pour 3 racks). Les 3 racks de DELL ont eu aussi un changement de switch. - problème SRM le 3/10 entre 11h et 14h : redémarrage du PNFS. - augmentation du Maxavailable des ressources u_dcache_xxx pour les groupes LHC (+200).
      • 2
        Sujets Support:
        Atlas: ====== * De nouveau un problème avec le TEAM GGUS ticket: Il n'a pas été transmis à Lagaffe pour action et suivi. * Tests de prestaging d'Atlas (je pense que les personnes de dcache vont en parler). Perspectives a court terme: - Reprise des tests de prestaging lorsque les problèmes découverts lors du premier essai seront résolus. - Test d'accès intensif à la base de données Oracle pour tester la procédure de reconstruction des données. * Quel est l'etat de preparation des nouvelles VOBOX.
      • 3
        AT Grille généralement:
        - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCache
        • a) Nouvelles VOs
          * vo.rhone-alpes.idgrilles.fr mappée sur le groupe rag * fkppl.kisti.re.kr mappée sur le groupe fkppl * A venir surement, une VO pour les formations
        • b) Reboot du CE cclcgceli01 ce week-end
        • c) Status des installations en cours
          - 3 VO Boxes en cours: * cclcgatlas03 * cclcgcms03 * cclcgsamap01 - 2 machines de services (CRL/SYSLOG) * cclcgsrvli01 * cclcgsrvli02
    • Charge et événements prévisibles pour la semaine à venir

      Demandes de production, annonces de transfert, data challenges, arrêts, installations, ...
      Tout cela uniquement s'il y a un intérêt général.
      Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général.

      • 4
        Arrêt du 15/10
      • 5
        Interruption réseau du 15/10
        une interruption de quelques minutes est à prévoir pour la connexion extérieur du CCIN2P3 le 15/10 entre 6 et 8 heures.
      • 6
        Service Nagios de production
    • Nouvelles des équipes du CC

      Sujets par équipe, avec un impact potentiel sur l'exploitation.

      • 7
        User support: premières impressions de l'interface xoops/xhelp - ggus