Réunion jointe Opération + AT Grille

Europe/Paris
322 (IN2P3)

322

IN2P3

Rolf Rumler (CNRS/IN2P3)
Description
Réunion en deux parties: 1. AT Grille Participants: ceux de la réunion AT Grille habituelle. 2. Opération site CCIN2P3 Participants: représentants de l'exploitation, du support et d'autres selon ordre du jour, plus ceux de la réunion AT Grille habituelle.
Comptes-rendus
    • 16:00 16:10
      Etat des projets Grille 10m
      - EGEE (Hélène) - EGI-Inspire - IdG (Rolf, Virginie, Yonny) - LCG (Pierre) - Grille régionale (Yonny) et projets en préparation, le cas échéant.
    • 16:10 16:15
      Nouvelles des coopérations 5m
      - EELA/GISELA - Asie (FCPPL, FJPPL/KEK, FKPPL/KISTI)
    • 16:15 16:20
      Formation et dissémination 5m
      Formations et actions de dissémination passées, en cours, à prévoir.
      Orateur: Virginie, tous
    • 16:20 16:35
      Préparations transition ROC Fr --> NGI Fr 15m
      - Site web France Grilles (Virginie) - Plan d'organisation des Opérations (Rolf)
      Orateur: Rolf
    • 16:35 16:40
      Affaires administratives 5m
      - Missions et absences dans la semaine à venir - Conférences / workshops annoncés
    • 16:40 16:45
      break 5m
    • 16:45 17:15
      Incidents et problèmes des VOs (CC, sites français, autres sites) 30m
      Sujets Exploitation+Stockage: ---------------------------------- Sujets Support: ------------------- _ATLAS :_ ***** Quelques problèmes de transferts vers le CC 15 Avril Le probème était dû au serveur SRM qui a du être redémarré. ***** Toujours des problèmes de finalisation des installations AFS. -demande ou action de synchronisation des tags sur les CEs - AFS et ATLAS support ont développé des crons et des scripts pour identifier les releases de software manquants ainsi que les volumes de AFS qui sont corrompus. - Pierre Girard test un montage NFS pour que le fichiers des tags sur les CEs soit commun à tous les CEs (évite l'envoi d'un job d'installation de release par CE) ***** Débût du reprocessing des données réelles de ATLAS le vendredi 22 Avril. Le reprocessing se déroule bien. Les incidents à relever: les 2 arrêts, l'un de Oracle le samedi soir et l'autre de AFS lundi. Atlas n'a pas arrêté son reprocessing à l'annonce du downtime AFS lundi soir. Pas d'erreur liees a ca et reprocessing effectue a ~98% a midi mardi. _CMS :_ * SAM tests : Quelques petites faiblesses SRM qui ont entrainés des SAMs en défaut. - Plantage la nuit du 24 au 25 : - Problemes sur la base de données oracle BQS ont forcé un downtime non programmé. Du coup, impact sur les services CEs FTS ... down => SAM en défaut. * jobs : OK * Autre : Ce jour 27 : Jobs de reprocessing qui ne consomment quasiment pas de CPU dans la matinée. Probablement relié à la panne AFS d'hier _LHCb :_ RAS _Alice :_ RAS Problèmes récurrents: ------------------------- AT Grille généralement: ---------------------------- - CE, BDII, VOMS... - SE, FTS, LFC, SRM, dCache
      Orateur: Tous
    • 17:15 17:20
      Charge et événements prévisibles pour la semaine à venir 5m
      Demandes de production, annonces de transfert, data challenges, arrêts, installations, ... Tout cela uniquement s'il y a un intérêt général. Aussi: des nouvelles des projets Grille, encore uniquement s'il y a un intérêt général. - RAPPEL: chaque intervention même à priori anodine qui pourrait avoir un impact sur la production nécessite un accord du comité de direction à partir du 4/12/2009
      Orateur: Tous
    • 17:20 17:25
      Nouvelles des équipes du CC 5m
      Sujets par équipe, avec un impact potentiel sur l'exploitation. Nouvelles des embauches
      Orateur: Un membre de chaque équipe
    • 17:25 17:30
      Divers 5m