Indisponibilité programmée / Scheduled outage

Nous procéderons à une opération de maintenance le mercredi 12 mars 2025 à 8h00 (CET).

  • Indico sera indisponible durant cette opération.
  • La durée prévisionnelle d'indisponibilité est estimée à une heure.

We will be performing maintenance on Wednesday, March 12, 2025, at 8:00 AM (CET).

  • Indico will be unavailable during this operation.
  • The estimated downtime is one hour.

Machine Learning pour informaticiens

Europe/Paris
Salle des conseils (Orsay)

Salle des conseils

Orsay

IJCLab Bâtiment 100 (anciennement "IPN Orsay")
Description

L’objectif principal de l’école est de fournir aux informaticiens des concepts généraux sur le Machine Learning et de définir ses domaines et conditions d’application à travers des cas concrets.

Cette formation vous permettra de :

  • Comprendre les approches classiques du ML et les algorithmes associés
  • Appréhender les méthodes de deep learning
  • Découvrir les librairies Python `scikit-learn` et `Keras` pour mettre en œuvre ces algorithmes
  • Avoir des clés pour déployer des environnements de ML en particulier sur GPU
  • Connaitre les usages dans nos disciplines
  • Vous interroger sur les enjeux du ML

Une part importante sera consacrée aux travaux dirigés. Une des journées sera organisée en sessions parallèles pour proposer des thématiques plus spécifiques aux communautés DEV et ASR respectivement.

La formation s'adresse à tout informaticien maîtrisant le langage Python, désireux de découvrir le machine learning ou amené à participer à des projets incluant du ML.

Chaque participant devra disposer de son propre ordinateur portable. Des consignes seront données à l’avance pour les configurations requises lors des TP.

Nous continuons à mettre tout en oeuvre pour que l'école ait lieu comme prévu, et ce  dans le respect des règles sanitaires en vigueur.

La salle initialement prévue à Gif sur Yvette ne permettant pas d'accueillir tous les stagiaires retenus en présentiel, nous avons été contraints de trouver une salle plus grande. L'école aura donc lieu sur le campus d'Orsay à IJCLab, bât 100, salle des conseils.

Comité d'organisation de l'ANF
    • 13:30 13:40
      Logistique de l'école 10m
      Orateur: Thierry OLLIVIER (IPNL)
    • 13:40 14:00
      Présentation de l'école 20m
      Orateur: Françoise Bouvet (IJCLab)
    • 14:00 15:45
      Une brève histoire de l'IA 1h 45m
      Orateur: Marc Duranton (CEA)
    • 15:45 16:15
      Pause café 30m
    • 16:15 17:00
      Vérification des environnements et introduction à Jupyter 45m

      Dans cette première courte session nous vérifierons que les environnements de chacun sont bien installés et nous procèderons à une courte introduction à Jupyter Lab et aux notebooks.

      Orateur: Alexandre Boucaud (APC / IN2P3)
    • 17:00 18:00
      TP Python -étude et visualisation d'un jeu de données 1h

      Dans ce premier TP nous allons nous familiariser avec un jeu de données de recensement en utilisant les différentes librairies scientifiques de Python (chargement des données, classement, visualisation, mini-étude).
      Ces données seront utilisées les deux jours suivants pour aborder le machine learning avec scikit-learn puis les réseaux de neurones.

      Orateur: Alexandre Boucaud (APC / IN2P3)
    • 09:00 09:30
      Introduction à scikit-learn pour l'apprentissage supervisé 30m

      Introduction à scikit-learn, la librairie de machine learning en Python

      Orateur: Loïc Estève (INRIA)
    • 09:30 10:30
      TP scikit-learn : classification des données numériques 1h
      Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn), Loïc Estève (INRIA)
    • 10:30 11:00
      Pause café 30m
    • 11:00 12:30
      TP scikit-learn : classifications des données en catégories 1h 30m

      TP/cours guidé

      Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn)
    • 12:30 14:00
      Déjeuner 1h 30m
    • 14:00 15:00
      Introduction à l'apprentissage non supervisé 1h

      Cours

      Orateur: Alexandre Boucaud (APC / IN2P3)
    • 15:00 16:00
      TP scikit-learn : validation croisée (partie 1) 1h

      TP/cours sur la validation croisée et la recherche d'hyperparamètres pour les modèles

      Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn), Loïc Estève (Inria)
    • 16:00 16:30
      Pause café 30m
    • 16:30 17:30
      TP scikit-learn : validation croisée (partie 2) 1h

      TP/cours sur la validation croisée et la recherche d'hyperparamètres pour les modèles

      Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn), Loïc Estève (Inria)
    • 17:30 18:00
      Réponse aux questions du jour 30m
    • 09:00 10:30
      Réseaux de neurones 1h 30m
      Orateur: Françoise Bouvet (IJCLab)
    • 10:30 11:00
      Pause café 30m
    • 11:00 12:30
      TP Mise en pratique 1h 30m
    • 12:30 14:00
      Déjeuner 1h 30m
    • 14:00 16:00
      Réseaux de convolution et LSTM 2h
      Orateur: Françoise Bouvet (IJCLab)
    • 16:00 16:30
      Pause café 30m
    • 16:30 17:30
      TP Mise en pratique 1h
    • 17:30 18:00
      Réponse aux questions du jour 30m
    • 09:00 10:30
      Groupe ASR: Exploitation ferme GPU
      Président de session: Bertrand Rigaud (CC-IN2P3)
    • 09:00 10:30
      Groupe DEV: Réseaux génératifs (1)
      Président de session: François Lanusse (CEA/CNRS)
    • 10:30 11:00
      Pause café 30m
    • 11:00 12:30
      Groupe ASR: Exploitation ferme GPU (2)
      Président de session: Bertrand Rigaud (CC-IN2P3)
    • 11:00 12:30
      Groupe DEV: Réseaux génératifs (2)
      Président de session: François Lanusse (CEA/CNRS)
    • 12:30 14:00
      Déjeuner 1h 30m
    • 14:00 16:00
      Groupe ASR: TP détection d'anomalies dans les journaux de log
    • 14:00 16:00
      Groupe DEV: TP Mise en pratique
    • 16:00 16:30
      Pause café 30m
    • 16:30 18:00
      Groupe ASR: TP détection d'anomalies dans les journaux de log
    • 16:30 18:00
      Groupe DEV: TP Mise en pratique
    • 09:00 10:00
      Explicabilité en ML 1h

      En 2014, après une thèse en physique des particules, Nicolas Meric s'est lancé dans l'entreprenariat en fondant la start-up DreamQuark. Cette société propose aux entreprises du secteur financier et des assurances des services de décision basés sur des modèles de deep learning. La particularité de DreamQuark se base sur une approche du machine learning la plus transparente possible en développant des outils permettant d'expliquer les décisions prises, ce qui en accroit la confiance auprès de ses clients. Nicolas nous proposera un état des lieux des techniques utilisées et une mise en perspective par rapports aux enjeux du deep learning.

      Orateur: Dr Nicolas Meric (CEO Dreamquark)
    • 10:00 10:45
      Robustesse des algorithmes 45m

      Des travaux récents ont montré que malgré l’utilisation de méthodes « classiques » de validation et de régularisation, les réseaux de neurones peuvent être vulnérables face à d’éventuelles attaques adverses. L’exemple de vulnérabilité est celui d’une modification légère d’une image sur quelques pixels qui peut suffire à tromper le réseau de neurones [Szegedy,2016]. Le cours introduira la formalisation de la vulnérabilité de l’apprentissage machine, des illustrations en reconnaissance de formes et quelques solutions envisagées pour rendre l’apprentissage plus robuste.

      Orateur: Dr Jean-Marc Martinez (CEA - DES)
    • 10:45 11:10
      Pause café 25m
    • 11:10 11:50
      Applications IRFU 40m

      Les algorithmes d’IA sont des outils particulièrement performants dans certains domaines (véhicules autonomes, robotique, reconnaissance d’images, aide à la prise de décisions, etc.), mais leurs utilisations en physique fondamentale demandent une connaissance approfondie des phénomènes étudiés tant pour la performance de ces outils que pour la validation des résultats.

      A l’Irfu, (Institut de Recherche sur les lois Fondamentales de l’Univers au CEA Paris-Saclay) et à l’IN2P3, nous utilisons depuis longtemps ces méthodes.

      Dans cette présentation, plusieurs exemples seront abordés, allant de l’analyse de galaxies en astrophysique, en passant par les analyses de physique au sein des détecteurs au CERN à Genève, sans oublier la physique nucléaire où les algorithmes génétiques permettent l’étude des quarks. Selon les problématiques étudiées, différentes méthodes peuvent être utilisées : méthodes de réseaux de neurones profonds génératifs, etc.

      Orateur: Dr Valérie Gautard (CEA - IRFU)
    • 11:50 12:30
      Applications IN2P3 40m

      Les algorithmes d’IA sont des outils particulièrement performants dans certains domaines (véhicules autonomes, robotique, reconnaissance d’images, aide à la prise de décisions, etc.), mais leurs utilisations en physique fondamentale demandent une connaissance approfondie des phénomènes étudiés tant pour la performance de ces outils que pour la validation des résultats.

      A l’Irfu, (Institut de Recherche sur les lois Fondamentales de l’Univers au CEA Paris-Saclay) et à l’IN2P3, nous utilisons depuis longtemps ces méthodes.

      Dans cette présentation, plusieurs exemples seront abordés, allant de l’analyse de galaxies en astrophysique, en passant par les analyses de physique au sein des détecteurs au CERN à Genève, sans oublier la physique nucléaire où les algorithmes génétiques permettent l’étude des quarks. Selon les problématiques étudiées, différentes méthodes peuvent être utilisées : méthodes de réseaux de neurones profonds génératifs, etc.

      Orateur: Dr Julien Donini (UBP/LPC/IN2P3)
    • 12:30 14:00
      Déjeuner 1h 30m
    • 14:00 14:30
      Bilan de l'école 30m
    • 14:30 15:30
      Machine learning et éthique 1h

      Quelques questions éthiques posées par le développement de l'Intelligence Artificielle

      Le développement de l’informatique en général et de l’intelligence artificielle en particulier pose des questions éthiques très différentes de celles posées, depuis Hippocrate, par le développement des sciences de la vie et de la médecine. Des valeurs traditionnelles, telles le respect de la vie privée, la transparence, l’intelligibilité... sont à repenser. La question de savoir si un être non humain, tel un algorithme ou un robot, peut avoir des valeurs émerge. Et le plus inattendu est que nous sommes menés à nous reposer une question que nous croyions résolue : en quoi les êtres humains sont-ils singuliers ?

      Orateur: Prof. Gilles Dowek (INRIA - ENS Paris Saclay)