Machine Learning pour informaticiens

Europe/Paris
Salle des conseils (Orsay)

Salle des conseils

Orsay

IJCLab Bâtiment 100 (anciennement "IPN Orsay")
Description

L’objectif principal de l’école est de fournir aux informaticiens des concepts généraux sur le Machine Learning et de définir ses domaines et conditions d’application à travers des cas concrets.

Cette formation vous permettra de :

  • Comprendre les approches classiques du ML et les algorithmes associés
  • Appréhender les méthodes de deep learning
  • Découvrir les librairies Python `scikit-learn` et `Keras` pour mettre en œuvre ces algorithmes
  • Avoir des clés pour déployer des environnements de ML en particulier sur GPU
  • Connaitre les usages dans nos disciplines
  • Vous interroger sur les enjeux du ML

Une part importante sera consacrée aux travaux dirigés. Une des journées sera organisée en sessions parallèles pour proposer des thématiques plus spécifiques aux communautés DEV et ASR respectivement.

La formation s'adresse à tout informaticien maîtrisant le langage Python, désireux de découvrir le machine learning ou amené à participer à des projets incluant du ML.

Chaque participant devra disposer de son propre ordinateur portable. Des consignes seront données à l’avance pour les configurations requises lors des TP.

Nous continuons à mettre tout en oeuvre pour que l'école ait lieu comme prévu, et ce  dans le respect des règles sanitaires en vigueur.

La salle initialement prévue à Gif sur Yvette ne permettant pas d'accueillir tous les stagiaires retenus en présentiel, nous avons été contraints de trouver une salle plus grande. L'école aura donc lieu sur le campus d'Orsay à IJCLab, bât 100, salle des conseils.

Comité d'organisation de l'ANF
    • 1
      Logistique de l'école
      Orateur: Thierry OLLIVIER (IPNL)
    • 2
      Présentation de l'école
      Orateur: Françoise Bouvet (IJCLab)
    • 3
      Une brève histoire de l'IA
      Orateur: Marc Duranton (CEA)
    • 15:45
      Pause café
    • 4
      Vérification des environnements et introduction à Jupyter

      Dans cette première courte session nous vérifierons que les environnements de chacun sont bien installés et nous procèderons à une courte introduction à Jupyter Lab et aux notebooks.

      Orateur: Alexandre Boucaud (APC / IN2P3)
    • 5
      TP Python -étude et visualisation d'un jeu de données

      Dans ce premier TP nous allons nous familiariser avec un jeu de données de recensement en utilisant les différentes librairies scientifiques de Python (chargement des données, classement, visualisation, mini-étude).
      Ces données seront utilisées les deux jours suivants pour aborder le machine learning avec scikit-learn puis les réseaux de neurones.

      Orateur: Alexandre Boucaud (APC / IN2P3)
    • 6
      Introduction à scikit-learn pour l'apprentissage supervisé

      Introduction à scikit-learn, la librairie de machine learning en Python

      Orateur: Loïc Estève (INRIA)
    • 7
      TP scikit-learn : classification des données numériques
      Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn), Loïc Estève (INRIA)
    • 10:30
      Pause café
    • 8
      TP scikit-learn : classifications des données en catégories

      TP/cours guidé

      Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn)
    • 12:30
      Déjeuner
    • 9
      Introduction à l'apprentissage non supervisé

      Cours

      Orateur: Alexandre Boucaud (APC / IN2P3)
    • 10
      TP scikit-learn : validation croisée (partie 1)

      TP/cours sur la validation croisée et la recherche d'hyperparamètres pour les modèles

      Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn), Loïc Estève (Inria)
    • 16:00
      Pause café
    • 11
      TP scikit-learn : validation croisée (partie 2)

      TP/cours sur la validation croisée et la recherche d'hyperparamètres pour les modèles

      Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn), Loïc Estève (Inria)
    • 12
      Réponse aux questions du jour
    • 13
      Réseaux de neurones
      Orateur: Françoise Bouvet (IJCLab)
    • 10:30
      Pause café
    • 14
      TP Mise en pratique
    • 12:30
      Déjeuner
    • 15
      Réseaux de convolution et LSTM
      Orateur: Françoise Bouvet (IJCLab)
    • 16:00
      Pause café
    • 16
      TP Mise en pratique
    • 17
      Réponse aux questions du jour
    • Groupe ASR: Exploitation ferme GPU
      Président de session: Bertrand Rigaud (CC-IN2P3)
    • Groupe DEV: Réseaux génératifs (1)
      Président de session: François Lanusse (CEA/CNRS)
    • 10:30
      Pause café
    • Groupe ASR: Exploitation ferme GPU (2)
      Président de session: Bertrand Rigaud (CC-IN2P3)
    • Groupe DEV: Réseaux génératifs (2)
      Président de session: François Lanusse (CEA/CNRS)
    • 12:30
      Déjeuner
    • Groupe ASR: TP détection d'anomalies dans les journaux de log
    • Groupe DEV: TP Mise en pratique
    • 16:00
      Pause café
    • Groupe ASR: TP détection d'anomalies dans les journaux de log
    • Groupe DEV: TP Mise en pratique
    • 18
      Explicabilité en ML

      En 2014, après une thèse en physique des particules, Nicolas Meric s'est lancé dans l'entreprenariat en fondant la start-up DreamQuark. Cette société propose aux entreprises du secteur financier et des assurances des services de décision basés sur des modèles de deep learning. La particularité de DreamQuark se base sur une approche du machine learning la plus transparente possible en développant des outils permettant d'expliquer les décisions prises, ce qui en accroit la confiance auprès de ses clients. Nicolas nous proposera un état des lieux des techniques utilisées et une mise en perspective par rapports aux enjeux du deep learning.

      Orateur: Dr Nicolas Meric (CEO Dreamquark)
    • 19
      Robustesse des algorithmes

      Des travaux récents ont montré que malgré l’utilisation de méthodes « classiques » de validation et de régularisation, les réseaux de neurones peuvent être vulnérables face à d’éventuelles attaques adverses. L’exemple de vulnérabilité est celui d’une modification légère d’une image sur quelques pixels qui peut suffire à tromper le réseau de neurones [Szegedy,2016]. Le cours introduira la formalisation de la vulnérabilité de l’apprentissage machine, des illustrations en reconnaissance de formes et quelques solutions envisagées pour rendre l’apprentissage plus robuste.

      Orateur: Dr Jean-Marc Martinez (CEA - DES)
    • 10:45
      Pause café
    • 20
      Applications IRFU

      Les algorithmes d’IA sont des outils particulièrement performants dans certains domaines (véhicules autonomes, robotique, reconnaissance d’images, aide à la prise de décisions, etc.), mais leurs utilisations en physique fondamentale demandent une connaissance approfondie des phénomènes étudiés tant pour la performance de ces outils que pour la validation des résultats.

      A l’Irfu, (Institut de Recherche sur les lois Fondamentales de l’Univers au CEA Paris-Saclay) et à l’IN2P3, nous utilisons depuis longtemps ces méthodes.

      Dans cette présentation, plusieurs exemples seront abordés, allant de l’analyse de galaxies en astrophysique, en passant par les analyses de physique au sein des détecteurs au CERN à Genève, sans oublier la physique nucléaire où les algorithmes génétiques permettent l’étude des quarks. Selon les problématiques étudiées, différentes méthodes peuvent être utilisées : méthodes de réseaux de neurones profonds génératifs, etc.

      Orateur: Dr Valérie Gautard (CEA - IRFU)
    • 21
      Applications IN2P3

      Les algorithmes d’IA sont des outils particulièrement performants dans certains domaines (véhicules autonomes, robotique, reconnaissance d’images, aide à la prise de décisions, etc.), mais leurs utilisations en physique fondamentale demandent une connaissance approfondie des phénomènes étudiés tant pour la performance de ces outils que pour la validation des résultats.

      A l’Irfu, (Institut de Recherche sur les lois Fondamentales de l’Univers au CEA Paris-Saclay) et à l’IN2P3, nous utilisons depuis longtemps ces méthodes.

      Dans cette présentation, plusieurs exemples seront abordés, allant de l’analyse de galaxies en astrophysique, en passant par les analyses de physique au sein des détecteurs au CERN à Genève, sans oublier la physique nucléaire où les algorithmes génétiques permettent l’étude des quarks. Selon les problématiques étudiées, différentes méthodes peuvent être utilisées : méthodes de réseaux de neurones profonds génératifs, etc.

      Orateur: Dr Julien Donini (UBP/LPC/IN2P3)
    • 12:30
      Déjeuner
    • 22
      Bilan de l'école
    • 23
      Machine learning et éthique

      Quelques questions éthiques posées par le développement de l'Intelligence Artificielle

      Le développement de l’informatique en général et de l’intelligence artificielle en particulier pose des questions éthiques très différentes de celles posées, depuis Hippocrate, par le développement des sciences de la vie et de la médecine. Des valeurs traditionnelles, telles le respect de la vie privée, la transparence, l’intelligibilité... sont à repenser. La question de savoir si un être non humain, tel un algorithme ou un robot, peut avoir des valeurs émerge. Et le plus inattendu est que nous sommes menés à nous reposer une question que nous croyions résolue : en quoi les êtres humains sont-ils singuliers ?

      Orateur: Prof. Gilles Dowek (INRIA - ENS Paris Saclay)