Réunion jointe Opération + AT Grille (Pierre)

Europe/Paris
322 (CCIN2P3)

322

CCIN2P3

Pierre Girard (CCIN2P3), Rolf Rumler (CNRS/IN2P3)
Description
Exceptionnellement seulement la première partie aura lieu: 1. Opération site CCIN2P3 Participants: représentants de l'exploitation, du support et d'autres selon ordre du jour, plus ceux de la réunion AT Grille habituelle. 2. AT Grille: cette partie est supprimée cette fois-ci.
    • 16:00 16:25
      Incidents et problèmes des VOs (CC, sites français, autres sites)
      • 16:00
        Sujets Exploitation: 10m
        - réduction de puissance le 29/09 pour travaux dans le local onduleur (7 racks ont été arrêtés lundi matin). travaux finis vers 15h. - Arret du 30/09 * passage en SL4 du serveur ccsrm * arret HPSS : optimisation de la base, modification de la conf (+6 lecteurs T10K) * arret acsls : passage en version 7.3, configuration pour ajout des 6 lecteurs T10K. La sl8500 n'a pas pu être mise en production faute de pièces de raccord. * changement du switch réseau de 6 racks de workers 100Mb -> Gb - arrêt pour passage en SL4 64b de 6 racks de workers (3 IBM et 3 Dell). ils ne seront remis en prod qu'aujourd'hui car entre temps cms a remarqué un défaut d'installation sur les machines migrées semaine 39 : il manquait des librairies 32b. la correction est longue car il faut examiner tous les RPM un par un (1 journée pour 3 racks). Les 3 racks de DELL ont eu aussi un changement de switch. - problème SRM le 3/10 entre 11h et 14h : redémarrage du PNFS. - augmentation du Maxavailable des ressources u_dcache_xxx pour les groupes LHC (+200).
      • 16:10
        Sujets Support: 10m
        Atlas: ====== * De nouveau un problème avec le TEAM GGUS ticket: Il n'a pas été transmis à Lagaffe pour action et suivi. * Tests de prestaging d'Atlas (je pense que les personnes de dcache vont en parler). Perspectives a court terme: - Reprise des tests de prestaging lorsque les problèmes découverts lors du premier essai seront résolus. - Test d'accès intensif à la base de données Oracle pour tester la procédure de reconstruction des données. * Quel est l'etat de preparation des nouvelles VOBOX.
      • 16:20
        AT Grille généralement: 5m
        - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCache
        • Nouvelles VOs 1m
          * vo.rhone-alpes.idgrilles.fr mappée sur le groupe rag * fkppl.kisti.re.kr mappée sur le groupe fkppl * A venir surement, une VO pour les formations
        • Reboot du CE cclcgceli01 ce week-end 1m
        • Status des installations en cours 1m
          - 3 VO Boxes en cours: * cclcgatlas03 * cclcgcms03 * cclcgsamap01 - 2 machines de services (CRL/SYSLOG) * cclcgsrvli01 * cclcgsrvli02
    • 16:25 16:40
      Charge et événements prévisibles pour la semaine à venir

      Demandes de production, annonces de transfert, data challenges, arrêts, installations, ...
      Tout cela uniquement s'il y a un intérêt général.
      Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général.

      • 16:25
        Arrêt du 15/10 5m
      • 16:30
        Interruption réseau du 15/10 5m
        une interruption de quelques minutes est à prévoir pour la connexion extérieur du CCIN2P3 le 15/10 entre 6 et 8 heures.
      • 16:35
        Service Nagios de production 5m
    • 16:40 16:45
      Nouvelles des équipes du CC

      Sujets par équipe, avec un impact potentiel sur l'exploitation.

      • 16:40
        User support: premières impressions de l'interface xoops/xhelp - ggus 5m