DU Data Science

Europe/Paris
202 (CC-IN2P3)

202

CC-IN2P3

Description

L'ensemble du matériel et les différents supports (cours et TPs) peuvent être trouvés dans le GitLab du CC-IN2P3 à l'adresse suivante (attention, encore en construction !) :

https://gitlab.in2p3.fr/ccin2p3-support/formations/du-data-science/03-2020/

    • 12:00 14:00
      Déjeuner 2h
    • 14:00 18:00
      Reproductibilité et notebooks
      • 14:00
        Introduction à la notion de reproductibilité grâce aux notebooks 2h

        Notebooks Jupyter & Org mode pour Emacs

        Orateur: Frederic Suter (CC IN2P3 / CNRS)
      • 16:00
        TP sur Org mode pour Emacs 2h
        Orateur: Frederic Suter (CC IN2P3 / CNRS)
    • 09:30 12:00
      Data engineering
      • 09:30
        Panorama des systèmes de stockage 2h 30m
        Orateur: Loïc Tortay (CC-IN2P3)
    • 12:00 14:00
      Déjeuner 2h
    • 14:00 18:00
      Exploration et analyse de données
      • 14:00
        CPU vs GPU 2h
        Orateurs: Bertrand Rigaud (USR6402), Sébastien Gadrat (CC-IN2P3)
      • 16:00
        Apprentissage de réseaux de neurones sur GPU 2h
        Orateurs: Bertrand Rigaud (USR6402), Sébastien Gadrat (CC-IN2P3)
    • 08:30 12:30
      Data engineering
      • 08:30
        Big Data et technologie NoSQL 4h
        Orateurs: Osman AIDEL (IN2P3-CC Grid service), Fabio Hernandez (CC-IN2P3)
    • 12:30 14:00
      Déjeuner 1h 30m
    • 14:00 18:00
      Data engineering
      • 14:00
        Écosystème HADOOP et SPARK 2h
        Orateurs: Osman AIDEL (IN2P3-CC Grid service), Fabio Hernandez (CC-IN2P3)
      • 16:00
        TP SPARK 2h
        Orateurs: Osman AIDEL (IN2P3-CC Grid service), Fabio Hernandez (CC-IN2P3)
    • 09:00 12:30
      Exploration et analyse de données
      • 09:00
        Environnement Python pour l'analyse et la visualisation de données 3h 30m

        Introduction à Pandas pour la Science de la donnée

        Orateurs: Fabio Hernandez (CC-IN2P3), Sébastien Gadrat (CC-IN2P3)
    • 12:30 14:00
      Déjeuner 1h 30m
    • 14:00 15:00
      Présentation du CC-IN2P3
      • 14:00
        Visite des salles machines 1h
        Orateur: Loïc Tortay (CC-IN2P3)
    • 15:00 18:00
      Exploration et analyse de données
      • 15:00
        Apprentissage de réseaux de neurones sur GPU 3h
        Orateurs: Bertrand Rigaud (CC-IN2P3), Sébastien Gadrat (CC-IN2P3)
    • 09:00 11:00
      Exploration et analyse de données
      • 09:00
        Environnement Python pour l'analyse et la visualisation de données 2h

        Introduction à Pandas pour la Science de la donnée

        Orateurs: Fabio Hernandez (CC-IN2P3), Sébastien Gadrat (CC-IN2P3)
    • 11:00 12:00
      Data engineering
      • 11:00
        DataFrame dans SPARK 1h
        Orateur: Osman AIDEL (IN2P3-CC Grid service)
    • 12:00 14:00
      Déjeuner 2h