13e Journées Informatiques IN2P3/IRFU

Europe/Paris
Description

L’édition 2021 des Journées informatiques IN2P3/IRFU aura lieu du lundi 15 novembre à 14h au mercredi 17 novembre à 17h. Elle fait suite à la journée en distanciel qui s'est tenue le 19 novembre 2020.

Ces 13e JI se tiendront à Paris, en présentiel, au centre Kellermann.  Pour des raisons liées à la situation sanitaire, nous ne pourrons accueillir que 80 personnes en présentiel (et nous pourrons également en loger 80 sur place). L'inscription est soumise à approbation.

Ces journées sont également proposées en mode distanciel afin que le plus grand nombre de personnes puisse participer. Tout le monde pourra bien sûr participer aux discussions via la visioconférence.

Nous vous invitons dès maintenant à soumettre vos résumés. Deux formats de présentation sont proposés :

  • exposé de 20 mins +10 mins de questions ;
  • exposé dit court de 10 mins + 5 mins de question ;
  • 5 mins, dite « présentation flash ».

Tout sujet pouvant présenter un intérêt pour notre communauté est le bienvenu, qu'il s'agisse de développements techniques, d'infrastructure, d'outils, de bonnes pratiques, de gouvernance, etc.

Le nombre de places est limité à 80 personnes. Pour des questions d’organisation, l’inscription est obligatoire et sera soumise à validation par le comité d’organisation. La priorité sera donnée aux collègues ayant une présentation. Enfin le "pass" sanitaire sera obligatoire.

La date limite de soumission de contributions est fixée au 22 octobre 2021.

Les vidéos des JI sont disponibles à cette adresse :

https://webcast.in2p3.fr/container/13eme-journees-informatiques-in2p3-irfu

Participants
  • Adrien Ramparison
  • Alexandre Boucaud
  • Alice Faure
  • Andrea Formica
  • Anita Lorek
  • Anne Garcia
  • Anthony GAUTIER DE LAHAUT
  • Antoine Boizard
  • Antoine Perus
  • Aresh Vedaee
  • Arnaud CHIRON
  • Arnaud Durocher
  • Benjamin Mare
  • Benoit Delaunay
  • Blandine DUCLOS
  • Bogdan Vulpescu
  • Carlos Carranza
  • Catherine Seznec
  • Cayetano Santos
  • Cecile Barbier
  • Christine GASQ
  • Cyril L'Orphelin
  • Cécile Cavet
  • dalmaz alexandre
  • Damien MONNET
  • David Chamont
  • Denis Pugnere
  • DOMINIQUE BONNET
  • Edith Knoops
  • Eduardo Sepulveda
  • Emmanuel Medernach
  • Eric Fede
  • Fouad Yahia
  • François Legrand
  • François Talour
  • Françoise BOUVET
  • Françoise Virieux
  • Frederic GIRAULT
  • Frédéric Melot
  • Frédérique Chollet
  • Gerard Marchal-Duval
  • Grégory Perrin
  • Guillaume Lalaire
  • Guillaume PHILIPPON
  • Hadrien Grasland
  • Hugo JIMENEZ-PEREZ
  • Imed MAGROUNE
  • Isabelle Moreau
  • Jean Marc HO
  • Jean-Claude Chevaleyre
  • Jean-François Rozé
  • Jean-Marc Colley
  • Jean-Michel Barbet
  • Jean-Paul Le Fèvre
  • joel surget
  • Justine YUAN
  • Jérôme Odier
  • Karine Marquois
  • Katy SAINTIN
  • Laure-Amélie Couturié
  • Laurent Caillat-Vallet
  • laurent noblet
  • Le Jeannic Patrick
  • Loic Tortay
  • Ludovic DUFLOT
  • Luisa Arrabito
  • Martin Souchal
  • Mathieu Walter
  • Maude Le Jeune
  • Maxime Jaume
  • Michel Jouvin
  • Michèle Sanguillon
  • Moufida Dziri-Marce
  • NABIL GARROUM
  • Nathalie Barré
  • Natthan Pigoux
  • Nicolas Bellemont
  • Nicolas Clementin
  • Nicolas Dosme
  • Olivier delhomme
  • Osman Aidel
  • Patricia Warin-Charpentier
  • Pavel Zakharov
  • Pei Yu
  • Philippe Gauron
  • Philippe Gras
  • Philippe Malbranque
  • Philippe SÉRAPHIN
  • Pierre Aubert
  • Pierre-Etienne Macchi
  • Pierre-François Honoré
  • Remi Ferrand
  • Renaud Vernet
  • Roland Boda
  • Roméo Molina
  • Sebastien Binet
  • sebastien geiger
  • Sebastien Zappino
  • Shebli Anvar
  • Sylvain Caillou
  • Sylvain Garrigues
  • Sylviane Molinet
  • Sébastien Gadrat
  • Tan Trung Ho
  • Thierry CHAVENTRÉ
  • Thierry Launay
  • Thierry MALLET
  • thomas roulet
  • Valerie Givaudan
  • Vanessa Hamar
  • Vincent LAFAGE
  • Xiaomei Niu
  • Yoann KERMORVANT
  • Yvan Calas
    • 14:00 16:15
      Session plénière
      • 14:00
        Introduction 15m
        Orateur: Françoise BOUVET (IJCLab)
      • 14:15
        Statut du CC-IN2P3 30m
        Orateur: Pierre-Etienne Macchi (CC-IN2P3)
      • 14:45
        Pilotage de la SSI et PSSI-CNRS 30m

        Avec cette présentation, je souhaite partager plus de 10 années de pilotage de la Sécurité de l’Information au laboratoire Subatech. Cela a commencé à l’issue d’une formation CNRS sur les systèmes de management de sécurité de l’information (SMSI) et les normes ISO 27000, à Roscoff, en septembre 2009. A la même époque, une réflexion sur la PSSI était en cours à l’IN2P3. Au retour de cette formation, j’ai proposé au directeur du laboratoire la création d’un comité de pilotage (CPSI) pour travailler sur une PSSI et poser les base d’un SMSI. Ce comité que j’anime est encore en place en 2021 avec un fonctionnement maintenant bien établi. Cette expérience me permet d’identifier les élements importants pour une prise en compte de la SSI par tous les personnels et facilite l’adoption des mesures de la PSSI du CNRS. Je montrerai comment fonctionne le CPSI et comment la PSSI CNRS est prise en compte.

        Orateur: Jean-Michel Barbet (Subatech)
      • 15:15
        Mise en place de la RGPD à IJCLab 30m

        Bien que la RGPD ne concerne pas uniquement l'informatique, elle se retrouve très souvent être gérée par l'exploitation informatique. A IJCLab nous avons commencé à recenser les traitements qui doivent être déclarés ainsi que les modalités pour. Le CNRS a progressé dans la méthodologie et propose des outils qui simplifient (un peu...) la tâche. Nous ferons un retour d'expérience sur la mise en application de la RGPD dans notre laboratoire.

        Orateurs: Valerie GIVAUDAN ({CNRS}UMR9012), Fouad Yahia (IJCLab)
      • 15:45
        Retour d'expérience sur la fusion des services informatiques ICJLab 30m

        Je propose une présentation sur l'expérience de création d'ICJLab au niveau de l'informatique, avec à la fois ses challenges humains et techniques

        Orateur: Michel Jouvin (IJCLab)
    • 16:15 16:45
      Pause 30m
    • 16:45 19:15
      Session plénière
      • 16:45
        DOMA : Data Organization Management Access 30m

        Je me propose de faire un statut du projet de R&D DOMA qui a pour objectif de préparer la gestion de la donnée scientifique à l’horizon 2028 (HL-LHC)

        Ce projet international qui a débuté en 2018 vise à étudier, proposer et quantifier les différentes évolutions possibles et usages des services de stockage de données scientifique et cela pour répondre aux besoins que sont : la gestion de la volumétrie, la gestion et usage de la donnée (data management) et bien évidement la gestion du coût.

        Je reviendrai également un peu sur la première compagne de tests qui a eu lieu en octobre et qui avait pour but de quantifier la montée en puissance des moyens (réseau, stockage disque, stockage de masse)

        Orateur: Eric Fede (CC-IN2P3/CNRS)
      • 17:15
        Activités de support aux utilisateurs au CC-IN2P3 30m

        Cette contribution donnera un aperçu des activités de support aux utilisateurs menées au CC-IN2P3.
        Dans ce cadre, nous présenterons les différentes thématiques de travail de l'équipe Support et ses récentes réalisations, et nous intégrerons également des éléments sur l'offre de service du Centre, sur les outils mis à disposition aux utilisateurs pour mener leurs travaux, ainsi que sur nos perspectives d'amélioration.
        La discussion qui suivra cette présentation pourra être l'occasion d'aborder les services à mettre en place pour mieux répondre aux besoins scientifiques et techniques.

        Orateur: Renaud Vernet (CC-IN2P3/CNRS)
      • 17:45
        Le RI3 et ses groupes thématiques 1h
        Orateurs: Cedric Muller (IPHC), Françoise BOUVET (IJCLab), Guillaume PHILIPPON (LAL - CNRS), Sebastien Geiger (IPHC IN2P3), Valerie GIVAUDAN ({CNRS}UMR9012)
    • 08:30 10:30
      Session plénière
      • 08:30
        Présentation du réseau TEAMLAB 30m

        Le réseau TEAMLAB de l'IN2P3 est un réseau sur le management d'équipe proposant à ses membres un lieu d'échange sur les problématiques liées au management ainsi que des outils et des accompagnements. Son but est de participer au développement d'une culture management bienveillante et respectueuse des individus, commune à l’IN2P3.

        Orateur: Christine GASQ (LPC)
      • 09:00
        Intégration continue et vérification de code VHDL en Python. 30m

        Le langage VHDL permet de décrire une architecture matérielle très bas niveau. Il permet de cibler des architectures reconfigurables de type FPGA, au prix d’un temps de compilation qui dépasse souvent une journée de travail. Comme alternative, et dans l’idée de tester le bon fonctionnement du code, il est de plus en plus nécessaire d’avoir recours à des bibliothèques de vérification fonctionnelle poussés (OSVVM), mais pas seulement. Il devient impératif sur des designs complexes de faire appel à des langages haut niveau (Python), couplés à des techniques souvent utilisées dans des contextes de développement logiciel, comme c’est le cas de l’intégration continue disponible sur des plateformes comme GitLab. Ces techniques, peu connues dans un contexte de conception matérielle bas niveau, offrent un cadre de simulation et test permettant d’économiser du temps, sortant de la boucle habituelle codage, compilation, test sur cible.

        Orateur: Cayetano Santos (Laboratoire des 2 Infinis Toulouse (L2IT) - CNRS/In2p3)
      • 09:30
        Docker : larguez les amarres ! 30m

        Depuis 2010 le petit monde des conteneurs logiciels est souvent réduit à Docker, pourtant ce n'est qu'une petite partie d'un écosystème vaste et hétéroclite ! Je vous propose de découvrir comment se passer complétement de Docker sans pour autant changer vos habitudes.

        Orateur: Martin Souchal (APC)
      • 10:00
        Serveur de calcul ambulant 30m

        Le retour au présentiel se précise enfin ! Mais avec lui vont hélas aussi revenir les problématiques pratiques liées à l'organisation d'événements présentiels, et notamment celle de la stabilité souvent aléatoire des infrastructures réseau des lieux d'accueil.

        Pour le formateur qui souhaite organiser un TP autour de la performance logicielle, cette instabilité est particulièrement difficile à vivre, car elle empêche l'utilisation de centres de calcul dédiés de façon déportée. On doit donc trop souvent se résoudre à l'alternative de faire au mieux avec les ressources locales aux ordinateurs portables des participants, ce qui n'est guère idéal :

        • L'interférence avec les outils graphiques utilisés et les tâches de fond du système d'exploitation typique nuit à la reproductibilité des mesures de performance logicielle. Si des solutions à ce problème existent, elles sont difficiles à mettre en oeuvre rapidement et sur un parc de machines de configuration très hétérogène.
        • Les contraintes thermiques et énergétiques des ordinateurs portables conduisent matériel et système d'exploitation à faire varier leurs caractéristiques de performances dans le temps, ce qui là encore nuit à la stabilité des mesures. Là encore, les contournements sont complexes à mettre en oeuvre dans le budget temps contraint d'une séance de TP.
        • Les ordinateurs portables des participants sont équipés de matériel très hétérogène, ce qui rend difficile la comparaison des performances obtenues en TP à une référence. C'est pourtant une étape importante d'un processus d'optimisation de performances logicielles : il ne suffit pas de calculer plus vite qu'avant, l'objectif est de calculer efficacement dans l'absolu.
        • L'ordinateur portable typique ne dispose souvent pas de matériel que l'on pourrait vouloir étudier dans un TP de calcul, tels que des processeurs à grand nombres de coeurs (permettant d'aborder la question du passage à l'échelle) ou des GPUs équipés de mémoire dédiée.

        Le groupe Reprises de l'IN2P3 a donc décidé d'explorer une alternative à ce statu quo en utilisant une partie du budget missions libéré par la crise sanitaire pour mettre au point un serveur de calcul transportable pouvant fonctionner en réseau local. L'objectif avoué de cette plate-forme est de permettre de bénéficier sans connexion internet fiable des avantages pédagogiques inhérents au travail sur cluster de calcul dans les TPs sur la performance logicielle que nous souhaitons organiser dans des cadres tels que les JIs et les ANFs.

        Dans cette contribution, je vous propose de présenter l'état actuel de ce projet, les développements technologiques qu'il a nécessité, les compromis que la solution technologique choisie implique, et si tout se passe bien je serai en mesure de faire une première démonstration publique de plusieurs capacités de la plate-forme au fil de mon exposé.

        Orateur: Hadrien Grasland (IJCLab)
    • 10:30 11:00
      Pause 30m
    • 11:00 13:10
      Session plénière
      • 11:00
        L’informatique quantique : préparer l’avenir à l’IN2P3 ? 30m

        Parmi les différentes futures technologies dites « quantiques », communications, capteurs, métrologie, cryptographie, il y a les aspects « calcul générique » et « simulations » qui ont fait l’objet de discussion pendant les dernières journées prospectives Calcul, algorithmes et données.
        Le OpenLab du CERN a inséré son initiative quantique dans la mise à jour 2020 de la stratégie européenne pour la physique des particules. Les investissements dans les recherches sur plusieurs technologies possibles ont connu une accélération importante, du coté des géants de l’informatique ainsi que dans les laboratoires du système publique.
        Pourtant, le changement de paradigme de calcul est considérable et nécessite une transition bien réfléchie des compétences du corpus des spécialistes en informatique. Dans le cadre d’un sujet très vaste, je vais présenter un exemple d’utilisation d’un processeur quantique IBM, disponible au grand publique, en espérant pouvoir illustrer quelques spécificités d’un tel système de calcul.

        Orateur: Bogdan Vulpescu (Laboratoire de Physique de Clermont)
      • 11:30
        Ceph au CC-IN2P3 30m

        Point sur l'infrastructure des clusters Ceph du CC-IN2P3 (4 clusters/~70 serveurs/8 Pio)
        Retour d'expérience sur l'utilisation de CephFS à grande échelle (> 5 Pio)

        Orateur: Loic Tortay (CC-IN2P3)
      • 12:00
        Git-sparse et Python pour un développement modulaire 15m

        Dans cette présentation nous allons visiter une des récentes fonctionalités de git (> 2.27) pour gérer des sous-répertoires ou de fichiers isolés dans un dépôt local. git-sparse, encore en état expérimentale, devient une alternative simple et effective aux sous-modules et sous-arbres git. Une application directe dans un environnement de développement python3 sera présentée.

        Orateur: Dr Hugo JIMENEZ-PEREZ (APC)
      • 12:15
        chiffrement et déchiffrement sans-tête 15m

        Démonstration du chiffrement/déchiffrement d'un PC Linux avec enregistrement d'une clef dans le TPM2 du BIOS ou en réseau

        Orateur: Pierre-François Honoré (CEA/DRF/Irfu - Université Paris Saclay)
    • 14:00 16:15
      Session plénière
      • 14:00
        Visualisation des données avec le logiciel Data Browser 15m

        Aujourd’hui, de plus en plus d’expériences et d’instruments scientifiques nécessitent une visualisation d’une grande quantité de données au travers de plusieurs applications dédiées. Ces applications peuvent superviser des variables en temps réel ou bien afficher des données historiées dans une base de données. Et par conséquence, un logiciel intuitif permettant l’affichage de plusieurs types de source de données est devenu très vite indispensable.

        En 2012, l’équipe informatique de contrôle commande du synchrotron SOLEIL, démarre le développement d’une application répondant à cet objectif, le DataBrowser. Ce dernier répond à une architecture modulaire et évolutive sur laquelle plusieurs instituts ont contribué au travers de 2 frameworks :
        • CDMA (Common Data Model Access), initialement développé à ANSTO(4), qui unifie l’accès aux données indépendamment du format physique (fichiers ou base de données …) et de son organisation logique.
        • COMETE (COMmunity of Extendable Toolkit for Experiment) framework graphique, initialement développé au synchrotron SOLEIL(2) qui fournit une librairie de composants graphiques et qui standardise la manière de se connecter à une donnée indépendamment du type de source au travers des paradigmes objets éprouvés et connus dans ce type de logiciel (MVC Modèle Vue Contrôleur, Fabrique …)

        Depuis, SOLEIL a développé plusieurs plugins pour le Data Browser : HDF/Nexus, TANGO(5). Et s’est ajouté à cela dans le cadre des activités de R&D de l’IRFU(1), des plugins dédiés au Framework de control commande EPICS(3) (Channel Access, Google Protocol Buffers (6)). L’objectif, étant de fournir un outil aux utilisateurs finaux qui n’auraient pas de temps, ni de compétences en programmation, une IHM (Interface Homme Machine) intuitive et épurée pour visualiser rapidement leurs données temps réelle et/ou leurs données archivées, en des phases de test durant lesquelles les applications finales n’existent pas encore.

        Références :
        (1) IRFU – http://irfu.cea.fr/
        (2) SOLEIL – https://www.synchrotron-soleil.fr/
        (3) EPICS – https://epics-controls.org/
        (4) ANSTO - https://www.ansto.gov.au/
        (5) TANGO - https://www.tango-controls.org/
        (6) Google Protocol Buffers - https://developers.google.com/protocol-buffers

        Orateur: Katy SAINTIN (CEA)
      • 14:15
        L'outil Dash 15m

        Dash est un framework qui permet de construire des applications web en Python avec de la visualisation interactive. Je présenterai l’outil et illustrerai par des applications développées à IJCLab dans des domaines aussi variés que l’astrophysique, le pôle santé ou l’informatique de gestion.

        Orateur: Mme Françoise BOUVET (IJCLab)
      • 14:30
        groot: reading ROOT data, with Go, faster than ROOT 30m

        ROOT est une suite de bibliothèques principalement écrites en C++.
        C'est également le format de fichier permettant de stocker les données de la plupart des expériences de physique des particules.

        Cependant, ce format de fichiers n'est pas formalisé ni standardisé.
        Le format de fichiers ROOT est simplement défini par ce qu'accepte la bibliothèque ROOT I/O.
        Il n'est donc possible de lire des fichiers ROOT qu'avec ROOT, et qu'avec ROOT C++.
        C'est une situation qui peut paraître assez délétère dans une perspective d'évolution des environnements de développement et d'exécution de programmes de physique des particules, sur le temps long.

        Depuis 2000, plusieurs projets de lecture/écriture de fichiers ROOT par d'autres bibliothèques que ROOT C++, voire même dans d'autres langages, ont été entrepris.
        Je passerais rapidement en revue ces projets alternatifs et leur filiation, puis je décrirai groot, la bibliothèque du projet Go-HEP qui permet de lire et d'écrire des fichiers ROOT.

        Je donnerai ensuite les caractéristiques et l'architecture générale des fichiers ROOT, ainsi que quelques grandeurs relatives aux performances de lecture/écriture de fichiers ROOT avec groot.
        Puis j'expliquerai le travail de réingénierie et l'optimisation des performances qui ont permis à groot de lire des fichiers ROOT plus rapidement que ROOT lui-même.

        Enfin, j'aborderai les perspectives d'évolution du format de fichiers ROOT avec ROOT7 et ses RNtuples; ainsi que les conséquences pour groot.

        Orateur: Dr Sebastien Binet (LPC/IN2P3)
      • 15:00
        AMI, un écosystème générique de metadonnées scientifiques 30m

        AMI (ATLAS Metadata Interface) est un écosystème générique pour l’agrégation, la transformation et le traitement de métadonnées scientifiques.
        Bénéficiant de presque 20 ans d'expérience dans le contexte du LHC (Large Hadron Collider), la seconde version majeure de l'écosystème a récemment été finalisée. Nous décrivons les choix techniques et les avantages qui en découlent pour la conception d'interfaces haut niveau orientées métadonnées.
        Côté backend, nous présentons l'implémentation du MQL (Metadata Querying Language), un langage de domaine spécifique permettant d'effectuer des requêtes sans connaitre dans la structure relationnelle des bases de données sous-jacentes.
        Côté frontend, nous décrivons AWF (AMI Web Framework), le framework permettant de développer simplement des interfaces utilisateurs.

        Orateur: Dr Jérôme Odier (LPSC/CNRS (Grenoble, FR))
      • 15:30
        Accélerateurs de calcul : d'OpenCL à SYCL 30m

        OpenCL a tenté, en son temps, d'offrir un API C standard pour tous les accélérateurs de calcul : GPUs, FPGAs, et les défunts Xeon Phi. Trop bas niveau et verbeux pour être écrit par un chercheur, soutenu du bout des lèvres par NVidia, ce standard a finalement surtout été porté par le milieu de l'informatique embarquée. Aujourd'hui, les mêmes acteurs retentent l'aventure avec le standard SYCL, qui se veut une extension de C++, plus haut niveau, s'appuyant sur des techniques en arrière-plan qui incluent OpenCL et CUDA. Son avenir est-il mieux assuré ?

        Orateur: David Chamont (IJCLab - IN2P3 - CNRS)
      • 16:00
        Présentation du site internet de Reprises 5m

        Le projet Reprises contribue depuis quelques années au regroupement d'information nécessaires à l'amélioration de la qualité logicielle en générale.
        Portabilité, Performance, Productivité et Précision (les 4P de David)

        Nous avons regroupé ces informations sous la forme d'un Guide destiné à la fois aux scientifiques désirant améliorer les performances de leurs programmes et aux personnes plus techniques.

        Orateurs: David Chamont (IJCLab - IN2P3 - CNRS), Luisa Arrabito (LUPM)
      • 16:05
        Inférence pour apprentissage automatique sur accélérateur FPGA 5m

        Les FPGA (Field Programmable Gates Array) ont été utilisés pendant longtemps pour le prototypage des ASICs (Application Specific Integrated Circuit) ou directement comme des processeurs de signaux numériques dans les chaînes d’acquisition des systèmes de détection.
        Pour le cas des détecteurs utilisés dans les expérience de physique des particules, les FPGA peuvent exécuter des algorithmes complexes, afin de constituer un premier niveau de sélection des événements (trigger). Les possibilités innées de parallélisme et pipeline opérationnel ont permis d’élargir l’utilisation des FPGA à une classe plus générique de calculs, avec une programmation beaucoup plus accessible que le langage de bas niveau HDL (Hardware Description Language) utilisé par les spécialiste en micro-électronique.
        Je vais présenter un cas d’utilisation d’un accélérateur FPGA (MUSTANG-F100-A10 SG1) pour l’inférence d’un modèle d’apprentissage automatique, avec la cadriciel OpenVINO de Intel©.

        Orateur: Bogdan Vulpescu (Laboratoire de Physique de Clermont)
      • 16:10
        Performance et flexibilité : HPC Proxy 5m

        Depuis quelques années, le développement de programmes performants se heurte à la multiplicité des architectures à cibler. Il existe en effet plus d'une vingtaine d'architectures différentes, rien que pour Intel, ce qui complique énormément la tâche des développeurs lorsqu'ils ont besoin d'obtenir la meilleure performance possible, et ce, quelque soit l'architecture ciblée (notamment sur la grille). Il est donc nécessaire de choisir l'architecture cible à la volée, ce qui peut s'avérer délicat.

        HPC Proxy est un générateur de code qui permet de créer une bibliothèque proxy qui se chargera de choisir la bonne architecture à la volée. Il est donc possible d'imbriquer des bibliothèques ayant des architecture cibles différentes de manière simple tout en conservant la meilleure performance.

        Orateur: Dr Pierre Aubert (LAPP)
    • 16:15 16:45
      Pause 30m
    • 16:45 18:00
      Piscine: Introduction à Maqao
      Président de session: Pierre Aubert (LAPP)
    • 18:00 19:00
      La bière dans tous ses états 1h
    • 08:30 10:30
      Session plénière
      • 08:30
        Le NoSQL s'invite au CC-IN2P3. 30m

        La science génère de plus en plus de données, pour les exploiter des systèmes intelligents de stockage tels que les bases de données intègrent des langages d’interrogation pour faciliter leur exploitation. Les SGBDR ont marqué l’histoire avec le modèle relationnel et l’introduction de moteur transactionnel. Toutefois, cette solution souffre par son architecture monolithique et un modèle de données rigide qui limitent les applications dans leur utilisation. C’est, en partie, pour lever cette limite que de nouvelles bases de données ont émergé : le NoSQL est né. Aujourd’hui, le service de base de données du CC-IN2P3 élargit son offre au travers des technologies NoSQL et vous propose de découvrir ses bases de données d’un nouveau genre, puissantes, flexibles et réactives à travers ses plateformes MongoDB et ElasticSearch.

        Orateur: Osman Aidel (CC-IN2P3)
      • 09:00
        The French Science Center (FSC) for SVOM experiment 30m

        SVOM is a satellite experiment that should start in 2023 and is built by a collaboration of institutes in France and China.
        The SVOM ground segment consists of a set of services dedicated to the processing and management of data coming from the satellite.
        In France we have deployed these services in what we call FSC (French Science Center). In this presentation we will show the architecture of the FSC, the tools and frameworks for development, integration and deployment as well as the choices to describe the communications among different entities belonging to the Svom Ground segment and interacting with the FSC.

        Orateur: Andrea Formica (CEA/Saclay)
      • 09:30
        Graph Neural Network pour la reconstruction de traces dans le détecteur ATLAS 30m

        La phase de haute luminosité du LHC au CERN va entraîner à partir de 2027 une forte augmentation du volume et de la complexité des données enregistrées par le détecteur ATLAS installé au CERN, à Genève. Considérant les ressources de calcul prévues, les algorithmes actuels de reconstruction de traces de particules sont trop lents et, sans amélioration, le programme de physique de la collaboration ATLAS pourrait être réduit. Les algorithmes de reconstruction basés sur les Graph Neural Networks (GNNs) sont une voie très prometteuse vers une nouvelle génération d’algorithme permettant une reconstruction rapide des traces. Des travaux récents ont montré de bons résultats sur des données de simulation simplifiée du détecteur. L’effort actuel des équipes « Calcul Algorithmes et Données » et « Physique des Hautes Energies » du Laboratoire des 2 Infinis - Toulouse porte sur la mise au point d’algorithmes sur des simulations réalistes du trajectographe de ATLAS avec des modèles de GNN plus performants. Dans cet exposé, les travaux de nos équipes sur la préparation des données, l’optimisation des modèles GNN et les performances de la reconstruction des traces seront détaillés.

        Orateur: Sylvain Caillou (L2I Toulouse, CNRS/IN2P3)
      • 10:00
        Dyablo : le C++ moderne pour le HPC avec Kokkos 30m

        Les nouvelles architectures de calcul HPC posent de nouveaux défis pour la simulation numérique. Les architectures matérielles pour l'exascale sont plus variées que pour les générations précédentes, et parfois plus difficiles à programmer. Du GPU aux nouveaux processeurs ARM, il devient difficile d'écrire du code performant sur toutes les architectures.

        Dans cette présentation, je présente les travaux qui ont été menés pour développer le code Dyablo écrit en C++ moderne avec la librairie Kokkos.
        Dyablo permet d'effectuer des simulation astrophysiques allant de la cosmologie à la formation de systèmes planétaires. Il utilise le Raffinement Adaptatif de Maillage (AMR) pour améliorer la résolution dans les régions de l'espace les plus intéressantes. Le code utilise la librairie Kokkos pour écrire des noyaux de calcul qui peuvent être exécutés sur CPU ou sur GPU.

        Je présenterai comment les problématiques de portabilité de performances ont été résolues grâce à Kokkos et comment certains algorithmes liés à l'AMR ont été repensés pour s'adapter aux GPUs.

        Orateur: Arnaud Durocher (CEA DRF/IRFU/DEDIP/LILAS)
    • 10:30 11:00
      Pause 30m
    • 11:00 12:30
      Session plénière
      • 11:00
        Julia, un rêve HEP qui se réalise 30m

        Le temps d'exécution est un point critique pour le code développé pour la recherche en physique des hautes énergies (HEP pour « high energy physics »). Les expériences requièrent typiquement une puissance de calcul importante pour le traitement de données. Celles auprès du LHC font appel à une grille de calcul, le "Worlwide LHC computing grid", qui comptent un million de cœurs de processeurs. Dans cette communication, nous investiguerons le potentiel du langage de programmation Julia pour l'analyse de données HEP. Julia est un langage de programmation hautes-performances et haut-niveau qui apporte à la fois une facilité de développement de code similaire au langage Python et une rapidité d'exécution similaire aux langages C, C++ et Fortan. Il offre le même niveau d'abstraction que Python, une expérience de type interpréteur fondée sur une technique similaire à l'interpréteur de ROOT et un noyau pour le cahier électronique (« notebook ») Jupyter. Des mesures de performances sur des cas spécifiques aux applications HEP et leur comparaison avec celles obtenues avec C++ et Python seront présentés.

        Orateur: Philippe Gras (CEA Saclay IRFU)
      • 11:30
        Retour sur les discussions concernant Linux au dernier HEPiX 30m

        Red Hat a modifié sa politique de sortie des versions de Linux (RHEL & CentOS). La nouvelle politique proposée est moins adaptée aux sites académiques et data centres qui l'utilisent pour effectuer de la production.

        Lors du dernier HEPiX, qui s'est déroulé en distanciel du 25 au 29 octobre [*], une session spéciale de discussion (Bird of a Feather) a été organisée afin de faire un point sur les contraintes et les stratégies possibles au niveau des sites.

        Dans cette présentation, je ferai un retour de ces discussions, et présenterai les principales orientations ou stratégies envisagées par les principaux sites (tels que le CERN, FNAL ou encore BNL)

        [*] https://indico.cern.ch/event/1078853/

        Orateur: Sébastien Gadrat (CC-IN2P3)
      • 12:00
        Les outils communs CAO/IAO IN2P3 30m

        Le CC-IN2P3 pilote de nombreux outils collaboratifs mis à disposition des laboratoires par la direction technique de l'institut.
        Ces outils visent à faciliter les développements en CAO mécanique et en calculs par éléments finis dans les projets menés par les laboratoires de l'IN2P3.
        Il s'agit des plateformes collaboratives de conception Catia V5 / Smarteam en transition vers Catia V6 / 3D EXperience et de la mutualisation des logiciels de calculs éléments finis ANSYS, CST et Comsol.
        L'intégration des logiciel de calculs éléments finis dans le cluster HPC et/ou GPU du CC-IN2P3 est à l'étude.

        Orateur: Mathieu Walter (CC-IN2P3)
    • 14:00 15:30
      Piscine: Introduction à l'optimisation de code
      Président de session: Pierre Aubert (LAPP)
    • 15:30 16:00
      Conclusions des JIs2021 30m