Formation IA

Europe/Paris
Bât. 451 p. 31 (CEA Paris-Saclay)

Bât. 451 p. 31

CEA Paris-Saclay

Aurore Lomet (CEA), Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD), Inna Kucher (CEA-ISAS), Jean-Baptiste Blanchard (CEA DEA ISAS), Riccardo Finotello (CEA Paris-Saclay)
Description

Formation Intelligence Artificielle

La formation IA est proposée par le LIAD (Laboratoire d'Intelligence Artificielle et science des Données) du CEA. Elle se déroule sur cinq jours, avec des cours et des travaux pratiques, et vise à fournir des éléments d'introduction au monde du machine learning et de l'intelligence artificielle.

Objectifs

L'IA transforme rapidement de nombreux secteurs, il est essentiel de disposer d'une formation complète et correcte pour comprendre et maîtriser ces nouveaux outils. Les défis actuels, tels que l'analyse de grandes quantités de données et la prise de décisions basées sur des prédictions, nécessitent des compétences spécifiques. De plus, les opportunités croissantes dans le domaine de l'IA offrent de nouvelles perspectives pour l'innovation et l'efficacité.

La formation met l'accent sur l'importance de la qualité des données et sur les méthodes pour les analyser. En suivant cette formation, les participants, qu'ils soient spécialistes ou non du domaine, acquerront les éléments nécessaires pour comprendre les avancées de l'IA et les appliquer de manière efficace dans leur contexte professionnel.

Les formateurs

 

Dr. Aurore Lomet Aurore Lomet est une ingénieure-chercheuse spécialisée en découverte causale, intelligence artificielle, apprentissage automatique et traitement des séries temporelles. 

Au sein du LIAD, ses recherches se concentrent sur des sujets théoriques, comme le traitement des données structurées dans la causalité et son évalutation ainsi que sur des enjeux pratiques en collaboration avec d'autres équipes du CEA. En parallèle de ses activités, elle intervient dans le cadre de l'institut DATA IA et de la SaclAI-School pour la formation en IA. 
Dr. Geoffrey Daniel Geoffrey Daniel est ingénieur chercheur spécialisé en machine learning et son application pour le traitement de données scientifiques.

Ses activités au sein du LIAD se portent à la fois sur des sujets théoriques, comme la quantification d'incertitudes pour les prédictions des réseaux de neurones et sur des problématiques applicatives en collaboration avec d'autres équipes du CEA. Il pilote le réseau ALLEGRIA qui propose des séminaires scientifiques autour des applications de l'IA au CEA.
Dr. Inna Kucher Inna Kucher est ingénieure-chercheuse spécialisée dans l'apprentissage automatique appliqué à l'analyse des données de physique et l'apprentissage profond pour les applications de vision par ordinateur.

Après un poste d'ingénieure-chercheuse dans un laboratoire d'Intelligence Artificielle embarquée au CEA/DRT, elle a rejoint le Laboratoire d'Intelligence Artificielle et de science des Données (LIAD) en 2024. Elle concentre actuellement ses recherches sur la quantification des incertitudes provenant de l'application des réseaux neuronaux à l'analyse des données.
Dr. Riccardo Finotello

Riccardo Finotello est physicien théoricien spécialisé en machine learning. Ses centres d'intérêt s'étendent de la théorie de l'information à l'IA pour l'analyse de données dans divers domaines scientifiques.

Il a rejoint le CEA en 2021. Il développe de méthodes d'explicabilité des modèles d'IA et de techniques pour la quantification d'incertitudes en machine learning.

Organisateurs

Logo du CEA Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un acteur majeur de la recherche, au service de l'État, de l'économie et des citoyens. Il apporte des solutions concrètes à leurs besoins dans différents domaines.
LIAD Le Laboratoire d'Intelligence Artificielle et science de Données (LIAD) de la Direction des énergies (DES) du CEA est spécialiste du développement d'outil d'IA et d'analyse statistique pour les sciences analytiques, avec experts dans les domaines des mathématiques appliqués, physique, statistique et génie logiciel.
    • 09:00 16:30
      Introduction générale: Introduction: IA, probabilité et statistique

      Introduction aux concepts probabilistes et statistiques de base

      Présidents de session: Dr Aurore Lomet (CEA), Dr Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD)
      • 09:00
        Introduction: IA, probabilité et statistique 3h

        Ce cours aborde d'abord les notions générales liées à l'IA et met en place le vocabulaire et les définitions permettant de se repérer dans le domaine du Machine Learning. Il donne des éléments méthodologiques qui seront appliqués au cours des différentes sessions de la semaine de formation.
        Dans un second temps, il propose des rappels sur les concepts probabilistes et statistiques, à la base des approches par apprentissage automatique. Il montrera l'application directe de ces concepts sur les modèles les plus fondamentaux du Machine Learning, les régressions linéaires et logistiques.

        Orateurs: Dr Aurore Lomet (CEA), Dr Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD)
      • 12:00
        Repas 1h 30m
      • 13:30
        Travaux pratiques 3h

        Ce TP met en oeuvre des algorithmes de régression linéaire avec descente de gradient. Un exercice est aussi prévu sur un cas de classification en appliquant les concepts probabilistes vus au cours de la séance du matin.
        L'objectif de ce TP est de se refamiliariser avec Python tout en mettant en application des premiers algorithmes de Machine Learning.

        Orateurs: Dr Aurore Lomet (CEA), Dr Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD)
    • 09:00 16:30
      Introduction au Machine Learning: Introduction aux méthodes supervisées

      Introduction aux méthodes supervisées et non supervisées de machine learning

      Présidents de session: Dr Aurore Lomet (CEA), Riccardo Finotello (CEA Paris-Saclay)
      • 09:00
        Support vector machines, arbres de décision, ensembles 3h

        Cette session spécifique dédiée au Machine Learning supervisé explore les algorithmes utilisés à la base pour des problèmes de classification. Les Support Vector Machines (SVMs), les arbres de décision et méthodes d'ensemble associées sont des classes d'algorithmes intéressantes par leur explicabilité et interprétabilité. Ce cours décrit leur fonctionnement et leur utilisation.

        Orateurs: Dr Aurore Lomet (CEA), Riccardo Finotello (CEA Paris-Saclay)
      • 12:00
        Repas 1h 30m
      • 13:30
        Travaux pratiques 3h

        Ce TP met en application les méthodes présentées la matinée : SVM, arbres de décisions et XGBoost. Il permet de se familiariser avec des bibliothèques Python très utilisées en Machine Learning, en particulier scikit-learn.

        Orateurs: Dr Aurore Lomet (CEA), Riccardo Finotello (CEA Paris-Saclay)
    • 09:00 16:30
      Introduction au Machine Learning: Introduction aux méthodes non supervisées

      Introduction aux méthodes supervisées et non supervisées de machine learning

      Présidents de session: Dr Aurore Lomet (CEA), Riccardo Finotello (CEA Paris-Saclay)
      • 09:00
        Réduction de la dimensionnalité 1h 30m

        Cette session aborde un dernier algorithme supervisé, les K plus proches voisins (KNN), et met en lumière la problématique liée à la malédiction de la dimensionnalité. Le cours introduit ensuite les premières notions liées au Machine Learning non supervisé, et en particulier la réduction de la dimensionnalité. Elle montre des méthodes permettant de mettre en évidence des relations entre les données, comme l'Analyse en Composantes Principales, ainsi que des algorithmes de représentation de données dans des espaces à faible dimension à travers la méthode t-SNE.

        Orateurs: Dr Aurore Lomet (CEA), Riccardo Finotello (CEA Paris-Saclay)
      • 10:30
        Travaux pratiques 1h 30m

        Ce TP propose d'appliquer les méthodes abordées dans la première partie de la matinée : KNN, PCA et t-SNE.

        Orateurs: Dr Aurore Lomet (CEA), Riccardo Finotello (CEA Paris-Saclay)
      • 12:00
        Repas 1h 30m
      • 13:30
        Clustering 1h 30m

        Ce cours continue d'explorer les méthodes non supervisées en abordant les problématiques de clustering. Ce type d'approche a pour objectif de mettre en évidence des groupes de données présentant des similarités, et il rassemble un grand nombre de méthodes, dont les principales seront présentées dans le cadre de cette session.

        Orateurs: Dr Aurore Lomet (CEA), Riccardo Finotello (CEA Paris-Saclay)
      • 15:00
        Travaux pratiques 1h 30m

        Cette séance de TP met en application des méthodes de clustering : les K-Means, DBSCAN et les Gaussian Mixtures.

        Orateurs: Dr Aurore Lomet (CEA), Riccardo Finotello (CEA Paris-Saclay)
    • 09:00 18:00
      Introduction au Deep Learning: Introduction aux réseaux de neurones

      Introduction aux réseaux de neurones et leur utilisation

      Présidents de session: Dr Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD), Inna Kucher (CEA-ISAS)
      • 09:00
        Introduction aux réseaux de neurones 1h 30m

        Cette seconde partie de la semaine se focalise sur les approches de Deep Learning. Ce cours introduit les modèles à la base de l'apprentissage profond : les réseaux de neurones. Il montre les principes mathématiques à la base de ces modèles et leur apprentissage. Enfin, il aborde leur utilisation dans le cadre de l'analyse de données de type image à travers les réseaux de neurones convolutifs.

        Orateurs: Dr Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD), Inna Kucher (CEA-ISAS)
      • 10:30
        TP Réseaux de neurones 1h 30m

        Cette session de TP propose de développer des premiers réseaux de neurones appliqués à la reconnaissance d'images sur une base de données très classiquement utilisée en Deep Learning : MNIST pour la classification d'images de chiffres. Elle permet de se familiariser avec une des bibliothèques principales du Deep Learning : TensorFlow, ainsi que la surcouche de haut niveau Keras.

        Orateurs: Dr Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD), Inna Kucher (CEA-ISAS)
      • 12:00
        Repas 1h 30m
      • 13:30
        Quantification d'incertitudes en Deep Learning 1h 30m

        Cette session introduit les notions de quantification d'incertitudes en Deep Learning, fondamentales pour garantir la fiabilité des modèles. Ce sujet reste un problème ouvert dans la littérature sur le Deep Learning, et le cours propose de définir les concepts associés et d'explorer certaines méthodes de l'état de l'art.

        Orateurs: Dr Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD), Inna Kucher (CEA-ISAS)
      • 15:00
        TP réseaux de neurones (suite) 1h 30m

        Cette séance de TP propose de continuer l'implémentation des réseaux de neurones vues dans la matinée, en particulier en abordant les réseaux de neurones convolutifs. Pour celles et ceux qui seront suffisamment avancées et à l'aise avec les premiers exercices, des TP supplémentaires sont proposées pour aborder des concepts plus avancés, comme les auto-encodeurs, la quantification d'incertitudes ou encore la robustesse des modèles.

        Orateurs: Dr Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD), Inna Kucher (CEA-ISAS)
    • 09:00 16:00
      Introduction au Deep Learning: Techniques d'IA moderne

      Introduction aux réseaux de neurones et leur utilisation

      Présidents de session: Inna Kucher (CEA-ISAS), Riccardo Finotello (CEA Paris-Saclay)
      • 09:00
        Techniques avancées pour les réseaux de neurones 2h

        Cette session s'intéresse à des modèles avancés fondés sur les réseaux de neurones. Il aborde en particulier les Graph Neural Networks (GNNs), vus comme une généralisation des réseaux de neurones convolutifs pour des données qui peuvent se représenter sous forme de réseau. Puis, il introduit les modèles Transformers, à la base des algorithmes de traitement du langage naturel, en plein essor ces dernières années avec les grands modèles de langage comme GPT, Bard, Deep Seek, Le Chat de Mistral AI...

        Orateurs: Inna Kucher (CEA-ISAS), Riccardo Finotello (CEA Paris-Saclay)
      • 11:00
        Démo (modèles de langage) 30m

        Du fait du coût calculatoire des entraînements de ces modèles avancés, des démonstrations sont proposées à la place des séances de TP. Cette séance de démo s'intéressera plus particulièrement à HuggingFace, qui est une plateforme de modèles de fondation utilisé pour aborder des problématiques variées en IA.

        Orateurs: Inna Kucher (CEA-ISAS), Riccardo Finotello (CEA Paris-Saclay)
      • 11:30
        Repas 1h 30m
      • 13:00
        Introduction à l'IA générative 2h 30m

        Cette dernière séance se concentrera sur l'IA générative, qui permet entre autres de générer du contenu réaliste, comme des fausses images. Le cours abordera la problématique de la génération de données à haute dimension et les méthodes, fondées sur les réseaux de neurones, qui ont été développées pour l'aborder, comme les Variational AutoEncoders, les Generative Adversarial Networks, les Normalizing Flows et les modèles de diffusion.

        Orateurs: Inna Kucher (CEA-ISAS), Riccardo Finotello (CEA Paris-Saclay)
      • 15:30
        Démo (génération d'images) 30m

        Cette séance de démonstration montrera la mise en œuvre de modèles de génération d'images, et le couplage avec des modèles de traitement du langage pour effectuer de la génération conditionnelle.

        Orateurs: Inna Kucher (CEA-ISAS), Riccardo Finotello (CEA Paris-Saclay)
    • 16:00 16:30
      Q&A

      Scéance de questions et wrap-up de la formation.

      Présidents de session: Dr Aurore Lomet (CEA), Dr Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD), Inna Kucher (CEA-ISAS), Riccardo Finotello (CEA Paris-Saclay)
      • 16:00
        Questions et wrap-up 30m

        Cette séance de clôture permet d'effectuer ensemble le bilan de la semaine et de revenir sur les points méthodologiques essentiels. Elle sera l'occasion aussi d'échanger sur les dernières questions des participants et participantes.

        Orateurs: Dr Aurore Lomet (CEA), Dr Geoffrey Daniel (CEA/DES/ISAS/DM2S/SGLS/LIAD), Inna Kucher (CEA-ISAS), Riccardo Finotello (CEA Paris-Saclay)