Machine Learning pour informaticiens

Name: Machine Learning pour informaticiens
Start: 2020-09-21T13:30:00+02:00
End: 2020-09-25T15:30:00+02:00
Location: Orsay

21 sept. 2020, 13:30 → 25 sept. 2020, 15:30 Europe/Paris

Salle des conseils (Orsay)

Salle des conseils

Orsay

IJCLab Bâtiment 100 (anciennement "IPN Orsay")

Description

L’objectif principal de l’école est de fournir aux informaticiens des concepts généraux sur le Machine Learning et de définir ses domaines et conditions d’application à travers des cas concrets.

Cette formation vous permettra de :

Comprendre les approches classiques du ML et les algorithmes associés
Appréhender les méthodes de deep learning
Découvrir les librairies Python `scikit-learn` et `Keras` pour mettre en œuvre ces algorithmes
Avoir des clés pour déployer des environnements de ML en particulier sur GPU
Connaitre les usages dans nos disciplines
Vous interroger sur les enjeux du ML

Une part importante sera consacrée aux travaux dirigés. Une des journées sera organisée en sessions parallèles pour proposer des thématiques plus spécifiques aux communautés DEV et ASR respectivement.

La formation s'adresse à tout informaticien maîtrisant le langage Python, désireux de découvrir le machine learning ou amené à participer à des projets incluant du ML.

Chaque participant devra disposer de son propre ordinateur portable. Des consignes seront données à l’avance pour les configurations requises lors des TP.

Nous continuons à mettre tout en oeuvre pour que l'école ait lieu comme prévu, et ce dans le respect des règles sanitaires en vigueur.

La salle initialement prévue à Gif sur Yvette ne permettant pas d'accueillir tous les stagiaires retenus en présentiel, nous avons été contraints de trouver une salle plus grande. L'école aura donc lieu sur le campus d'Orsay à IJCLab, bât 100, salle des conseils.

Comité d'organisation de l'ANF

ecole-info-2020-organisation-l@in2p3.fr

lun. 21 septembre
- 1
  
  Logistique de l'école
  
  Orateur: Thierry OLLIVIER (IPNL)
- 2
  
  Présentation de l'école
  
  Orateur: Françoise Bouvet (IJCLab)
- 3
  
  Une brève histoire de l'IA
  
  Orateur: Marc Duranton (CEA)
- 15:45
  
  Pause café
- 4
  
  Vérification des environnements et introduction à Jupyter
  
  Dans cette première courte session nous vérifierons que les environnements de chacun sont bien installés et nous procèderons à une courte introduction à Jupyter Lab et aux notebooks.
  
  Orateur: Alexandre Boucaud (APC / IN2P3)
- 5
  
  TP Python -étude et visualisation d'un jeu de données
  
  Dans ce premier TP nous allons nous familiariser avec un jeu de données de recensement en utilisant les différentes librairies scientifiques de Python (chargement des données, classement, visualisation, mini-étude).
  Ces données seront utilisées les deux jours suivants pour aborder le machine learning avec scikit-learn puis les réseaux de neurones.
  
  Orateur: Alexandre Boucaud (APC / IN2P3)
mar. 22 septembre
- 6
  
  Introduction à scikit-learn pour l'apprentissage supervisé
  
  Introduction à scikit-learn, la librairie de machine learning en Python
  
  Orateur: Loïc Estève (INRIA)
- 7
  
  TP scikit-learn : classification des données numériques
  
  Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn), Loïc Estève (INRIA)
- 10:30
  
  Pause café
- 8
  
  TP scikit-learn : classifications des données en catégories
  
  TP/cours guidé
  
  Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn)
- 12:30
  
  Déjeuner
- 9
  
  Introduction à l'apprentissage non supervisé
  
  Cours
  
  Orateur: Alexandre Boucaud (APC / IN2P3)
- 10
  
  TP scikit-learn : validation croisée (partie 1)
  
  TP/cours sur la validation croisée et la recherche d'hyperparamètres pour les modèles
  
  Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn), Loïc Estève (Inria)
- 16:00
  
  Pause café
- 11
  
  TP scikit-learn : validation croisée (partie 2)
  
  TP/cours sur la validation croisée et la recherche d'hyperparamètres pour les modèles
  
  Orateurs: Alexandre Boucaud (APC / IN2P3), Jérémie du Boisberranger (INRIA/Fondation scikit-learn), Loïc Estève (Inria)
- 12
  
  Réponse aux questions du jour
mer. 23 septembre
- 13
  
  Réseaux de neurones
  
  Orateur: Françoise Bouvet (IJCLab)
- 10:30
  
  Pause café
- 14
  
  TP Mise en pratique
- 12:30
  
  Déjeuner
- 15
  
  Réseaux de convolution et LSTM
  
  Orateur: Françoise Bouvet (IJCLab)
- 16:00
  
  Pause café
- 16
  
  TP Mise en pratique
- 17
  
  Réponse aux questions du jour
jeu. 24 septembre
- Groupe ASR: Exploitation ferme GPU
  
  Président de session: Bertrand Rigaud (CC-IN2P3)
- Groupe DEV: Réseaux génératifs (1)
  
  Président de session: François Lanusse (CEA/CNRS)
- 10:30
  
  Pause café
- Groupe ASR: Exploitation ferme GPU (2)
  
  Président de session: Bertrand Rigaud (CC-IN2P3)
- Groupe DEV: Réseaux génératifs (2)
  
  Président de session: François Lanusse (CEA/CNRS)
- 12:30
  
  Déjeuner
- Groupe ASR: TP détection d'anomalies dans les journaux de log
- Groupe DEV: TP Mise en pratique
- 16:00
  
  Pause café
- Groupe ASR: TP détection d'anomalies dans les journaux de log
- Groupe DEV: TP Mise en pratique
ven. 25 septembre
- 18
  
  Explicabilité en ML
  
  En 2014, après une thèse en physique des particules, Nicolas Meric s'est lancé dans l'entreprenariat en fondant la start-up DreamQuark. Cette société propose aux entreprises du secteur financier et des assurances des services de décision basés sur des modèles de deep learning. La particularité de DreamQuark se base sur une approche du machine learning la plus transparente possible en développant des outils permettant d'expliquer les décisions prises, ce qui en accroit la confiance auprès de ses clients. Nicolas nous proposera un état des lieux des techniques utilisées et une mise en perspective par rapports aux enjeux du deep learning.
  
  Orateur: Dr Nicolas Meric (CEO Dreamquark)
  
  Explainability_in2p3.pdf
- 19
  
  Robustesse des algorithmes
  
  Des travaux récents ont montré que malgré l’utilisation de méthodes « classiques » de validation et de régularisation, les réseaux de neurones peuvent être vulnérables face à d’éventuelles attaques adverses. L’exemple de vulnérabilité est celui d’une modification légère d’une image sur quelques pixels qui peut suffire à tromper le réseau de neurones [Szegedy,2016]. Le cours introduira la formalisation de la vulnérabilité de l’apprentissage machine, des illustrations en reconnaissance de formes et quelques solutions envisagées pour rendre l’apprentissage plus robuste.
  
  Orateur: Dr Jean-Marc Martinez (CEA - DES)
  
  ApprentissageRobusteJMM.pdf
- 10:45
  
  Pause café
- 20
  
  Applications IRFU
  
  Les algorithmes d’IA sont des outils particulièrement performants dans certains domaines (véhicules autonomes, robotique, reconnaissance d’images, aide à la prise de décisions, etc.), mais leurs utilisations en physique fondamentale demandent une connaissance approfondie des phénomènes étudiés tant pour la performance de ces outils que pour la validation des résultats.
  
  A l’Irfu, (Institut de Recherche sur les lois Fondamentales de l’Univers au CEA Paris-Saclay) et à l’IN2P3, nous utilisons depuis longtemps ces méthodes.
  
  Dans cette présentation, plusieurs exemples seront abordés, allant de l’analyse de galaxies en astrophysique, en passant par les analyses de physique au sein des détecteurs au CERN à Genève, sans oublier la physique nucléaire où les algorithmes génétiques permettent l’étude des quarks. Selon les problématiques étudiées, différentes méthodes peuvent être utilisées : méthodes de réseaux de neurones profonds génératifs, etc.
  
  Orateur: Dr Valérie Gautard (CEA - IRFU)
  
  20200925_EcoleML_VG.pdf
- 21
  
  Applications IN2P3
  
  Les algorithmes d’IA sont des outils particulièrement performants dans certains domaines (véhicules autonomes, robotique, reconnaissance d’images, aide à la prise de décisions, etc.), mais leurs utilisations en physique fondamentale demandent une connaissance approfondie des phénomènes étudiés tant pour la performance de ces outils que pour la validation des résultats.
  
  A l’Irfu, (Institut de Recherche sur les lois Fondamentales de l’Univers au CEA Paris-Saclay) et à l’IN2P3, nous utilisons depuis longtemps ces méthodes.
  
  Dans cette présentation, plusieurs exemples seront abordés, allant de l’analyse de galaxies en astrophysique, en passant par les analyses de physique au sein des détecteurs au CERN à Genève, sans oublier la physique nucléaire où les algorithmes génétiques permettent l’étude des quarks. Selon les problématiques étudiées, différentes méthodes peuvent être utilisées : méthodes de réseaux de neurones profonds génératifs, etc.
  
  Orateur: Dr Julien Donini (UBP/LPC/IN2P3)
  
  ANF-ML-250920.pdf
- 12:30
  
  Déjeuner
- 22
  
  Bilan de l'école
- 23
  
  Machine learning et éthique
  
  Quelques questions éthiques posées par le développement de l'Intelligence Artificielle
  
  Le développement de l’informatique en général et de l’intelligence artificielle en particulier pose des questions éthiques très différentes de celles posées, depuis Hippocrate, par le développement des sciences de la vie et de la médecine. Des valeurs traditionnelles, telles le respect de la vie privée, la transparence, l’intelligibilité... sont à repenser. La question de savoir si un être non humain, tel un algorithme ou un robot, peut avoir des valeurs émerge. Et le plus inattendu est que nous sommes menés à nous reposer une question que nous croyions résolue : en quoi les êtres humains sont-ils singuliers ?
  
  Orateur: Prof. Gilles Dowek (INRIA - ENS Paris Saclay)

Choisissez le fuseau horaire

Machine Learning pour informaticiens

Salle des conseils

Orsay