Réunion Gestion de l'exploitation Grille

Europe/Paris
322

322

Pierre Girard (CCIN2P3)
Participants
  • Cyril L'Orphelin
  • David Bouvet
  • Micael Gonzalez
  • Nadia LAJILI
  • Pierre Girard
  • Pierre-Emmanuel Brinette
  • Rolf Rumler
  • Sylvain Reynaud
    • 15:00 15:40
      Arrêt du 18 septembre 40m
      Rappel du mail de Suzanne: Services-généraux : - test du groupe électrogène (durée 1/2 journée), ca impacte seulement l'armoire H. - arrêt de l'armoire électrique F pour poser des appareils de mesure de consommation électrique (durée ?), Infrastructure : - Intervention sur les switchs centraux nécessitant une coupure réseau totale (30mins). - Intervention sur le cluster Oracle nécessitant un arrêt de service partiel voire total (reconfiguration réseau et disque 2h environ). - Intervention sur les serveurs AFS nécessitant un arrêt de service (un minimum d'une 1/2 journée). - Intervention sur 4 racks IBM contenant le serveur et des movers HPSS nécessitant un arrêt de service total (une 1/2 journée au moins à prévoir). - Intervention sur les serveurs SUN x4500 (mise à jour des systèmes & microcodes) nécessitant un arrêt de service. SIC : - Application du patch de sécurité trimestriel d'Orale sur nos serveurs. Stockage : - HPSS : reconfiguration pour integrer au moins les 8 derniers T10K. SUN : - arrêt de la robotique SL8500 pour mise a jour du micro-code (1/2 journée). Il y aura donc un arrêt total des services pour au moins une demi-journée voir plus. A cause de l'arrêt AFS, beaucoup de serveurs ne seront accessibles que dans l'après-midi.
      - Puisque Oracle est arrêté, les services sauvegardés habituels ne pourront pas fonctionner. Donc, un scheduled downtime pour la journée. Annonce aux VOs pour VOMS et LFC. Le 17, à faire : * Top BDII, basculer sur celui du LAL ou du LAPP. * Fermer les CEs. * Un serveur VMWare sans AFS prévu pour LFC, VOMS, site BDII * Prévoir un planning pour la fin de semaine.
    • 15:40 15:55
      Exploitation des sites 15m
      - Pour les classic SEs, ils restent ON pour un mois le temps de migrer et faire le ménage. - Nouveautés de l'été: * Worker SL4 (Pierre-Emm) Plusieurs pbs. Perl n'était pas bien installé. Xavier a réinstallé. * UI SL4. Install différente des WNs. 4 UIs en SL4_32 - Allocations 8 V20Z disponibles. Machines de services internes (nagios, backup, ...) à migrer sur les SL4 Cluster de serveurs VMWare: - Pierre-emm a un script qui clone les VMs - Christophe se renseigne pour un espace partagé entre les serveurs VMWare.
      • Arrêt des SEs classiques 5m
        Le 03/09 à 10:00, cclcgseli01 et cclcgseli02 sont définitivement sortis de production, au profit des SEs SRM : ccsrm (LCG) et ccsrm02 (EGEE). Il faut migrer les données des SEs classiques vers les SEs SRM (Lionel). Il faut mettre à jour la base du LFC Biomed (Pierre).
      • Nouveautés en production 5m
        - Nouveau lcg_env (Pierre) - Mises-à-jour de l'été (Pierre-Emmanuel)
        Orateurs: M. Pierre Girard (CCIN2P3), M. Pierre-Emmanuel Brinette (Equipe Grille)
      • Allocation de machines et Migrations 5m

        Revue des migrations programmées : page des migrations grille

        Sujets à aborder

        • Etat de migration des serveurs VMWare
        • Nombre de V20Z disponible
        • Besoins de machines grilles ?
        Orateur: M. Christophe Bonnaud (CCIN2P3)
    • 15:55 16:00
      Divers 5m
      - Cluster de CEs et GPFS (Pierre-Emmanuel) - Mise en place de la formation "Administrateurs de sites" (Me 24 ou Je 25 Oct.)
      - Cluster de CEs et GPFS: PE va recommencer, mais pour l'instant, rien ne le bloque. - Machines de formation: Christophe va nous tenir au courant - Liste grid-rox: ajout de pierre-emm et nadia