Anthony Correia PhD Defense

Europe/Paris
Salle des Séminaires (Salle 12-22-RC-08) (LPNHE)

Salle des Séminaires (Salle 12-22-RC-08)

LPNHE

Description

The PhD Defense will be held at "Salle des Séminaires" at LPNHE (Sorbonne Université, Jussieu).

How to get to LPNHE? https://lpnhe.in2p3.fr/spip.php?article80

How to get to "Salle des Séminaires": room 12-22-RC-08
- Corridor 12-22
- Level RC
- Room 8

Zoom Meeting: https://cern.zoom.us/j/65031167486?pwd=7Vjq4EFEwROFa3Ab6q5e1GPbaVZ3rl.1

  • lun. 15 décembre
    • 09:00 09:55
      Track Finding in the Velo at LHCb using Graph Neural Networks 55m

      Abstract

      Since 2022, during Run 3, LHCb has relied on Allen, a fully GPU-based trigger capable of reconstructing about 30 million collisions per second. For Run 5 of the HL-LHC, scheduled in the next decade, the increase in luminosity and granularity will make events heavier and make the throughput constraints even stricter. In this context, my thesis adapts the Exa.TrkX pipeline, based on graph neural networks (GNNs), to LHCb’s first tracking detector, the VELO, and then compares it to Allen’s reference GPU algorithm, “Search by Triplets”. The comparison covers both the physics performance and the throughput, on exactly the same hardware, which is a major advantage. The resulting pipeline is named ETX4VELO. Specifically, I have: (i) built and adapted training datasets with the Python libraries XDIGI2CSV and then digout; (ii) developed a robust evaluation framework with the Python library MonteTracko; (iii) tuned and further developed Exa.TrkX to adapt it to the VELO, a detector with well-defined vertical planes where tracks sometimes intersect; (iv) ported the C++/CUDA inference into Allen via the TensorRT and ONNX Runtime inference engines, with combinatorial steps written in CUDA. The physics performance matches that of “Search by Triplets”, but the throughput is still about a thousand times lower. This result nonetheless constitutes a solid and innovative starting point, with several avenues for optimization, in particular model quantization.

      Résumé

      Depuis 2022, pendant le Run 3, LHCb s’appuie sur Allen, un déclenchement entièrement GPU capable de reconstruire environ 30 millions de collisions par seconde. Pour le Run 5 du HL-LHC prévu dans la prochaine décennie, la hausse de luminosité et de granularité alourdira les événements et rendra les contraintes de débit encore plus strictes. Dans ce contexte, ma thèse adapte le pipeline Exa.TrkX, fondé sur des réseaux de neurones à graphe (GNN), au premier détecteur de suivi de LHCb, le VELO, puis le compare à l’algorithme GPU de référence d’Allen, « Search by Triplets ». La comparaison couvre à la fois la précision physique et le débit, sur exactement le même matériel, ce qui est un avantage majeur. Le pipeline obtenu est baptisé ETX4VELO. Concrètement, j’ai : (i) constitué et adapté des jeux de données d’entraînement avec les bibliothèques Python XDIGI2CSV puis digout ; (ii) développé un cadre d’évaluation robuste avec la bibliothèque Python MonteTracko ; (iii) ajusté et fait évoluer Exa.TrkX pour l’adapter au VELO, un détecteur à plans verticaux bien définis où les traces s’interceptent parfois ; (iv) porté l’inférence C++/CUDA dans Allen via les moteurs d'inférence TensorRT et ONNX Runtime, avec des étapes combinatoires écrites en CUDA. Les performances physiques égalent celles de « Search by Triplets », mais le débit reste environ mille fois inférieur. Ce résultat constitue néanmoins un point de départ solide et innovant, avec plusieurs pistes d’optimisation, notamment la quantification des modèles.

    • 09:55 11:00
      Questions 1h 5m
    • 11:00 12:00
      Doctoral committee deliberation 1h
    • 12:00 12:30
      Doctoral committee verdict 30m