14e Journées Informatiques IN2P3/IRFU

Name: 14e Journées Informatiques IN2P3/IRFU
Start: 2022-11-14T13:30:00+01:00
End: 2022-11-17T12:15:00+01:00
Location: No location set

14–17 nov. 2022

Fuseau horaire Europe/Paris

Comité d'organisation

CLO-JI2022-L@in2p3.fr

Liste des Contributions

13. Bienvenue

Dr Gines MARTINEZ (Subatech CNRS/IN2P3 IMT Atlantique Univ Nantes)

14/11/2022 14:00

Exposé (20 + 10 min)

Stratégie et enjeux du calcul frugal

Mot de bienvenu

14. Les nouveautés de l'Irfu

Imed MAGROUNE

14/11/2022 14:40

Exposé (20 + 10 min)

Stratégie et enjeux du calcul frugal

15. Les perspectives du calcul à l'IN2P3

Sabine Crépé-Renaudin (IN2P3)

14/11/2022 15:20

Exposé (20 + 10 min)

Stratégie et enjeux du calcul frugal

16. Les évolutions du CC-IN2P3

M. Benoit Delaunay (CC-IN2P3/CNRS)

14/11/2022 16:30

Exposé (20 + 10 min)

Stratégie et enjeux du calcul frugal

37. Séminaire Ecoinfo

M. Olivier Ridoux (IRISA)

14/11/2022 17:10

Séminaire

Le séminaire portera sur la conduite de la sobriété d’une institution. En particulier, l’intérêt des actions locales ne peut s'évaluer que par rapport à des objectifs globaux, et malheureusement, c’est ce contrôle que le plus souvent nous n’avons pas. Une fois ce contrôle installé, il ne reste que peu de choix pour modérer les objectifs fonctionnels, et pas seulement les moyens de les...

5. Analyse des coûts de compilation de programmes C++

Hadrien Grasland (IJCLab)

15/11/2022 09:00

Exposé (20 + 10 min)

Développement

Le C++ est un des langages de programmation qui offre le plus de contrôle sur son processus de compilation, via des mécanismes comme constexpr et la spécialisation de template. Bien utilisées, ces possibilités permettent d'accélérer l'exécution en préparant au maximum le travail du programme pendant sa compilation. Mais si l'on en abuse, elles peuvent aussi rendre la compilation très...

18. Utiliser le NVidia HPC SDK sur MUST

Pierre Aubert (LAPP)

15/11/2022 09:30

Exposé (20 + 10 min)

Développement

Depuis novembre 2020 le compilateur nvc++ permet de compiler un programme C++17 directement sur GPU sans passer par Cuda ou d'autres méthodes type Sycl, Kokkos, OpenCL.

Retour d'experience avec la simulation de la réaction de Gray Scott sur CPU et GPU.

23. Optimisation automatique de la cartographie des materiaux pour Acts

Corentin Allaire (IJCLab)

15/11/2022 10:00

Exposé (20 + 10 min)

Développement

En physique des particules, la trajectographie joue un rôle central dans le processus de reconstruction d'événements, et constitue un des principaux défis pour les expériences présentes et futures du fait de son fort impact sur la qualité des résultats physiques obtenus. Pour reconstruire ces trajectoires, nous avons recours à différents algorithmes utilisés de manière successive. Chacun de...

32. Calcul performant et pratique avec C++20

Sylvain Joube (LISN - IJCLab - Université Paris-Saclay)

15/11/2022 11:00

Exposé (20 + 10 min)

Développement

Dans le contexte du calcul haute performance et d'autant plus dans le cas du calcul scientifique et de la physique des hautes énergies, l'ergonomie et la performance du code de calcul sont deux aspects souvent antagonistes

Le code se doit d’être performant au niveau algorithmique et au niveau de son adéquation avec les architectures parallèles modernes. Au niveau ergonomie, il est vital que...

28. 𝔽, ou les malheurs du calcul

Vincent Lafage (CNRS)

15/11/2022 11:30

Exposé (20 + 10 min)

Développement

Je rappelle les problèmes inhérents au calcul avec des nombres à virgules flottante en les illustrant par quelques cas concrets dans notre activité de développeur pour des codes de physiques. J'insiste notamment sur les illusions associées au terme de ``precision´´ qu'on utilise pour qualifier la résolution de nos variables à virgule flottante. Je décris aussi quelques technique de...

30. Contrôle du calcul dans AGATA : du cristal à la mesure finale

Roméo Molina (CNRS)

15/11/2022 12:00

Exposé (20 + 10 min)

Développement

Le projet AGATA a pour objectif de construire un spectromètre de rayons gamma 4pi composé de 180 cristaux de germanium. Chaque cristal est divisé en 36 segments qui permettent d’identifier précisément les interactions qui se produisent dans le cristal et donc les caractéristiques du rayon gamma.
Lorsqu’un rayon gamma interagit avec le germanium il produit un signal électrique dans le segment...

4. Analyse de performances linux avec perf

Hadrien Grasland (IJCLab)

15/11/2022 17:00

Piscines (didacticiels)

Piscine

Pour optimiser les performances d'un programme, il faut d'abord comprendre ce qui les limite. Sous Linux, l'un des outils de référence est le profileur perf, qui bénéficie d'une intégration au noyau et peut de ce fait avoir une vision complète de l'utilisation des ressources système par un ou plusieurs processus. Dans ce TP, vous apprendrez à maîtriser ses possibilités.

7. Création d'un bastion SSH sécurisé et redondé

Benjamin Mare

16/11/2022 09:00

Exposé (20 + 10 min)

Sécurité

Dans le cadre de la rénovation de l'infrastructure ainsi que l'amélioration de l'expérience utilisateur, les administrateurs informatiques de l'IRFU cherchent à proposer un cluster de bastions SSH en haute disponibilité, tout en mettant en place une sécurité suffisante pour un service ouvert sur internet.

Plusieurs problèmes se posent alors: Comment diminuer au maximum la surface d'attaque...

9. Tentative de Phishing à l'IRFU

joel surget (CEA/Saclay IRFU)

16/11/2022 09:30

Exposé (20 + 10 min)

Sécurité

Une tentative de phishing très ciblée a été lancée sur l'IRFU les 29 juillet ,1er aout et 17 aout 2022...

Je reviendrai sur le déroulé des opérations, les conséquences, les problèmes liés au travail à distance... Et j'expliquerai les différents outils qui ont permis en partie de limiter les conséquences...

Joel Surget

6. Pycoa: Python pour comprendre le Covid-19

olivier dadoun (LPNHE)

16/11/2022 10:00

Exposé court (3 min)

Présentations Flash

PyCoa (www.pycoa.fr) est un ensemble de codes Python qui s’adresse aux personnes souhaitant s’approprier et étudier les données
relatives à la pandémie du Covid 19: lycéens, étudiants, analystes stratégiques, data journalistes et scientifiques.

Notre logiciel, contrairement à un Dash Board classique, présente l'intérêt de pouvoir accéder directement aux données de la Covid-19
depuis...

11. Tiny ML/DL : Voice Recognition on MCUs

Imed MAGROUNE

16/11/2022 10:05

Exposé court (3 min)

Présentations Flash

AI applications on tiny devices : Can we run a full CNN models for voice recognition or object detection on a Micro Controller Units (MCU) with only 516 KB of RAM ?
In this quick intervention I explain the need, the continuous process of optimization and the techniques of improvement of the codes which allow to make inferences on CNN models on ARM or RISK-V cards for real-time systems...

34. CODEEN : COllaborative DEvelopment ENvironement for Euclid spacecraft

Martin Souchal (APC), Pavel Zakharov ({IRD}UMR7164)

16/11/2022 10:10

Exposé court (3 min)

Présentations Flash

CODEEN (COllaborative DEvelopment ENvironement) est une plateforme de développement collaboratif basée notamment sur les principes et bonnes pratiques du développement basé sur les tests, de l'intégration continue et de la livraison continue. L'objectif de la plateforme est d'une part d'automatiser l'extraction des codes scientifiques, la construction de ces codes et l'exécution des tests, des...

35. Développement d’un Framework basé sur PyTorch Lightning pour l’entraînement de Graph Neural Network (GNN) pour le tracking

Sylvain Caillou (L2I Toulouse, CNRS/IN2P3, UT3)

16/11/2022 10:15

Exposé court (3 min)

Présentations Flash

Les phases de R&D en apprentissage profond (Deep Learning) peuvent être coûteuses en temps d’utilisation de ressources CPU et GPU. La définition de plan d’expériences claires, permettant une exploration efficace des hyperparamètres, l’évaluation des performances et le traçage des conditions expérimentales permet de tendre vers une utilisation plus efficace des ressources et donc vers plus de...

36. frugalité dans un contexte HPC

Pierre-François Honoré (CEA/DRF/Irfu - Université Paris Saclay)

16/11/2022 10:20

Exposé court (3 min)

Présentations Flash

Il nous est demandé de proposer des plans pour répondre à des restrictions sur l’approvisionnement électrique.
Notre salle machine apparaît comme un consommateur important pour l’IRFU (20% de la consommation totale de l'institut).Nous avons donc recherché des stratégies pour diminuer cette consommation en cas de pénurie.

38. Bilan des actions CCRI de l'année

Françoise BOUVET (IJCLab)

16/11/2022 10:25

Présentations Flash

39. Compliation des présentations

16/11/2022 10:40

Présentations Flash

25. L'écosystème de métadonnées AMI

Jérôme ODIER (CNRS/LPSC)

16/11/2022 11:00

Exposé (20 + 10 min)

Gestion des données

AMI (ATLAS Metadata Interface) est un écosystème générique pour l’agrégation et la transformation métadonnées ainsi que la sélection de données scientifiques par critères de métadonnées. Bénéficiant de 20 ans d'expérience dans le contexte du LHC (Large Hadron Collider), l'écosystème profite à plusieurs collaborations scientifiques dont ATLAS, NIKA2, n2EDM, ...

Nous présenterons comment...

27. Bases de données fédérées

Julius Hrivnac (IJCLab)

16/11/2022 11:30

Exposé (20 + 10 min)

Gestion des données

Je présenterai l'architecture d'accès aux données de manière transparente en utilisant plusieurs types de bases de données, à savoir base de données SQL, base de données NoSQL et base de données Graph.
Chaque base de données est utilisée pour le domaine où elle est la plus appropriée et un accès inter-technologie transparent est offert aux utilisateurs.

Les points forts et faibles des...

26. Préservation du patrimoine informatique

Fabien Wernli (Sysadmin), Pierre-Emmanuel Brinette (CC IN2P3), olivier dadoun (LPNHE)

16/11/2022 14:00

Exposé (20 + 10 min)

Patrimoine informatique

Ou n'attendons pas que nos vieilles bécanes se fossilisent ...

Peu de gens savent que le premier micro-ordinateur de l'histoire est français : le Micral-N. L'un des derniers exemplaires a quitté le pays en 2017 lors d'une vente aux enchères remportée par le co-fondateur de Microsoft.

La préservation du patrimoine numérique et informatique est un enjeu majeur de notre époque. De...

29. Découverte de Apache Airflow

Florian Vernotte (CC-IN2P3)

16/11/2022 14:30

Exposé (20 + 10 min)

Gestion de ressources de calcul

Apache Airflow est un puissant gestionnaire de workflow souvent utilisé pour la transformation de données.
Dans cette présentation, vous découvrirez son fonctionnement et ses différentes fonctionnalités en s’appuyant sur des cas d'utilisation au Centre de Calcul de l’IN2P3.

21. La plateforme de notebooks Jupyter au CC-IN2P3

Bernard Chambon (CC-IN2P3)

16/11/2022 15:00

Exposé (20 + 10 min)

Gestion de ressources de calcul

Depuis un peu plus de 2 ans le CC-IN2P3 propose une plateforme de notebooks Jupyter.
La présentation fera la point sur les composants logiciels sous-jacents mais aussi sur les services offerts par cette plateforme comme, par exemple, la possibilité de calcul sur GPU ou l'utilisation du framework Dask pour distribuer des tâches de calcul sur la ferme de batch SLURM.

8. BBQ (Beautiful Batch Query)

Guillaume Cochard (CC-IN2P3)

16/11/2022 15:30

Exposé (20 + 10 min)

Gestion de ressources de calcul

Le projet BBQ (Beautiful Batch Query) du Centre de Calcul de l'IN2P3 (CC-IN2P3) propose une interface web pour interroger l'état des fermes de calcul (HTCondor et Slurm, et dans le passé UGE) du CC-IN2P3. Actuellement, il permet de répondre aux besoins suivants :

Suivi opérationnel au niveau des jobs, utilisateurs et machines, avec pour certains éléments (jobs GPU, jobs en attente, etc.)...

24. Mise en place au CC-IN2P3 d'une plateforme d'analyse interactive pour les données de l'observatoire Vera C. Rubin

Gabriele Mainetti (CC-IN2P3)

16/11/2022 16:30

Exposé (20 + 10 min)

Gestion de ressources de calcul

L’observatoire Vera C. Rubin, en phase finale de construction au Chili, avec son télescope de 8,4 mètres et sa camera de 3.2 giga pixels, va produire plus de 20TB des données chaque nuit, 300 nuits par an. 50% de ces données seront traitées au CC-IN2P3 afin de produire des images prêtes pour la science ainsi qu'un catalogue astronomique. Au bout des 10 années d'exploitation, un jeu de données...

19. Déploiement et gestion d’un parc machine avec Cloudinit et Ansible

Francois LEGRAND ({CNRS}UMR7585)

16/11/2022 17:00

Exposé (20 + 10 min)

Gestion de ressources de calcul

Je présenterai notre nouveau système d'installation automatique, configuration et maintenance de nos postes de travail et serveurs basé sur TFTP+Cloudinit+Ansible.

22. Kubernetes, une histoire d'API

Jean Multigner (LAPP)

16/11/2022 17:30

Exposé (20 + 10 min)

Gestion de ressources de calcul

Dans cette présentation, nous discuterons des intérêts des API Kubernetes (appelées Ressources) et en quoi on t'elles permis l'évolution et l'adoption globale de Kubernetes.

20. An Exact Algorithm for the Linear Tape Scheduling Problem

Bertrand Simon

16/11/2022 18:00

Exposé (20 + 10 min)

Gestion de ressources de calcul

Les bandes magnétiques sont souvent considérées comme un moyen de stockage dépassé, mais sont encore utilisées pour stocker de grandes quantités de données. Les performances en lecture dépendent en partie de l'ordre dans lequel les fichiers demandés sont accédés sur une bande donnée. Cette problématique n'est toutefois presque pas étudiée dans la littérature de recherche en informatique. Dans...

12. La programmation des processeurs quantiques

Bogdan Vulpescu (Laboratoire de Physique de Clermont)

17/11/2022 09:00

Exposé (20 + 10 min)

Prospectives

Des processeurs quantiques sont aujourd’hui à la disposition du publique via le service Amazon Braket ou via IBM Quantum Experience, par exemple, gratuitement ou payant, et sont utilisés par un grand nombre d’utilisateurs intéressés par ce nouveau paradigme de calcul. Des processeurs beaucoup plus performants commencent à équiper quelques laboratoires au monde et des partenariats sont mis en...

31. Gestion des ressources en mémoire des GPU pour l’entraînement de Graph Neural Network (GNN) sur de larges graphes.

Sylvain Caillou (L2I Toulouse, CNRS/IN2P3, UT3)

17/11/2022 09:30

Exposé (20 + 10 min)

Prospectives

L’entraînement de modèles GNN sur de larges graphes est très couteux en mémoire. Cela représente un défi majeur pour les expériences dont les données éparses sont représentées par des graphes de très grande taille. Nous expliquerons les raisons de ce coût en mémoire spécifique aux architectures GNN et pourquoi les problèmes de dépassement de mémoire ne peuvent pas être résolus avec des...

33. Futur de Linux à l'IN2P3

Prospectives

17. Les projets techniques à l'IN2P3

M. Rodolphe Clédassou (IN2P3)

Exposé (20 + 10 min)

Stratégie et enjeux du calcul frugal

Choisissez le fuseau horaire

14e Journées Informatiques IN2P3/IRFU

Comité d'organisation