DU Data Science

Europe/Paris
202 (CC-IN2P3)

202

CC-IN2P3

Description

L'ensemble du matériel et les différents supports (cours et TPs) peuvent être trouvés dans le GitLab du CC-IN2P3 à l'adresse suivante :

https://gitlab.in2p3.fr/ccin2p3-support/formations/du-data-science/05-2019/

    • 11:00 12:00
      Présentation du CC-IN2P3
      • 11:00
        Présentation des services du CC-IN2P3 1h
        Orateurs: David Bouvet (CC-IN2P3 / CNRS), Loïc Tortay (CC-IN2P3)
    • 12:00 14:00
      Déjeuner 2h
    • 14:00 18:00
      Reproductibilité et notebooks
      • 14:00
        notebook Jupyter 4h
        Orateurs: Frederic Suter (CC IN2P3 / CNRS), Sébastien Gadrat (CC-IN2P3)
    • 08:30 12:30
      Data engineering
      • 08:30
        Panorama des systèmes de stockage 4h
        Orateur: Loïc Tortay (CC-IN2P3)
    • 12:30 14:00
      Déjeuner 1h 30m
    • 14:00 18:00
      Data engineering
      • 14:00
        Évolution des bases de données : du SQL vers le NoSQL 2h
        Orateurs: Osman AIDEL (IN2P3-CC Grid service), Antoine DUBOIS, Fabio Hernandez (CC-IN2P3)
      • 16:00
        TP sur MongoDB 2h
        Orateurs: Osman AIDEL (IN2P3-CC Grid service), Antoine DUBOIS, Fabio Hernandez (CC-IN2P3)
    • 08:30 12:30
      Exploration et analyse de données
      • 08:30
        CPU vs GPU 2h
        Orateurs: Bertrand Rigaud (USR6402), Sébastien Gadrat (CC-IN2P3)
      • 10:30
        Soumission de jobs TensorFlow sur GPUs sans Singularity 2h
        Orateurs: Bertrand Rigaud (USR6402), Sébastien Gadrat (CC-IN2P3)
    • 12:30 14:00
      Déjeuner 1h 30m
    • 14:00 18:00
      Data engineering
      • 14:00
        Écosystème HADOOP et SPARK 2h
        Orateurs: Osman AIDEL (IN2P3-CC Grid service), Antoine DUBOIS, Fabio Hernandez (CC-IN2P3)
      • 16:00
        TP SPARK 2h
        Orateurs: Osman AIDEL (IN2P3-CC Grid service), Antoine DUBOIS, Fabio Hernandez (CC-IN2P3)
    • 08:30 12:30
      Exploration et analyse de données
      • 08:30
        Environnement Python pour l'analyse et la visualisation de données 4h

        Introduction aux bibliothèques scientifiques suivantes : NumPy, Pandas, ainsi que des bibliothèques de visualisation comme Bokeh et Matplotlib.

        Orateurs: Fabio Hernandez (CC-IN2P3), David Bouvet (CC-IN2P3 / CNRS)
    • 12:30 14:00
      Déjeuner 1h 30m
    • 14:00 18:00
      Exploration et analyse de données
      • 14:00
        Environnement Python pour l'analyse et la visualisation de données 2h

        Introduction aux bibliothèques scientifiques suivantes : NumPy, Pandas, ainsi que des bibliothèques de visualisation comme Bokeh et Matplotlib.

        Orateurs: Fabio Hernandez (CC-IN2P3), David Bouvet (CC-IN2P3 / CNRS), Sébastien Gadrat (CC-IN2P3)
      • 16:00
        Soumission de jobs TensorFlow sur GPUs avec Singularity 2h
        Orateurs: Bertrand Rigaud (USR6402), Sébastien Gadrat (CC-IN2P3)
    • 10:00 12:00
      Examen
    • 12:00 14:00
      Déjeuner 2h
    • 14:00 16:00
      Présentation du CC-IN2P3
      • 14:00
        Visite des salles machines 1h
        Orateur: Loïc Tortay (CC-IN2P3)
      • 15:00
        Visite des salles machines et Questions/Réponses 1h
        Orateurs: Loïc Tortay (CC-IN2P3), Bertrand Rigaud (USR6402), David Bouvet (CC-IN2P3 / CNRS), Fabio Hernandez (CC-IN2P3), Osman AIDEL (IN2P3-CC Grid service), Sébastien Gadrat (CC-IN2P3)