# TP Programmation avec Keras - Cas MNIST, fonctionnalités avancées

Nous allons produire un réseau de neurones pour effectuer une classification sur le cas MNIST avec les bibliothèques keras/tensorflow. MNIST est une base de données composée d'images de chiffres. Nous allons mettre en place ici des fonctionnalités un peu plus avancées, liées à la régularisation, batchnormalisation, au jeu de validation, early stopping...

Dans ce TP, des cellules seront laissées à trous, il faudra les compléter suivant les consignes. Elles seront identifiées par le mot **Exercice**. Les **Vérifications** seront effectuées principalement par vous-mêmes, sur la bonne convergence des algorithmes ou leur bon fonctionnement.

Ci-dessous, on importe les bibliothèques qui seront utiles.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow.keras as keras

## Mise en place des données

Le code ci-dessous charge les données MNIST.

In [None]:
#NE PAS MODIFIER

(X_train, Y_train), (X_test, Y_test) = keras.datasets.mnist.load_data()

**Exercice** : Normalisez les données d'entrées en les divisant par 255 et passez les données de sortie sous forme catégorielle (one hot encoding, en utilisant keras.utils.to_categorical)

In [None]:
#A COMPLETER

**Exercice** : Nous allons utiliser des couches de convolution à deux dimensions. Ce type de couche attend en entrée des données de taille $n\times m \times c$, où $n$ et $m$ sont la taille de l'image, et $c$ correspond au nombre de canaux, il faut donc 3 dimensions au total. Par exemple, une image en couleurs RGB est composée de 3 canaux ($c = 3$). Dans le cas de MNIST, les images sont en niveaux de gris, donc composées d'un seul canal. Cependant, la dimension des images de X_train est (28,28) soit deux dimensions, et il faudrait lui ajouter une dimension pour qu'il y ait le bon nombre de dimensions.

Ci-dessous, effectuez cette correction grâce à la fonction np.expand_dims, en ajoutant une dimension sur le dernier axe (mot-clé axis = 3).

In [None]:
X_train = #A COMPLETER

X_test = #A COMPLETER

## Modèle Keras

### Création du modèle avec régularisation

**Exercice** : Créez un modèle avec Keras que vous appellerez "my_model".

**Instructions spécifiques** : 
- Les premières couches devront être des couches de convolution 2D : keras.layers.Conv2D. En argument, indiquez le nombre de neurones (ou de filtres), quelques-uns devraient suffire, pas la peine d'en mettre des dizaines. Puis, il faut préciser la taille des filtres : quelques pixels seront suffisants. Vous pouvez mettre la taille sous la forme (n,m) si vous souhaitez des filtres rectangulaires ou juste n si vous voulez des filtres carrés. Enfin, vous pouvez aussi préciser une fonction d'activation (de type "relu".
- La toute première couche de convolution doit comporter l'input_shape. Attention : on a ajouté une dimension.
- Faites suivre chaque couche de convolution d'une couche de MaxPooling2D (keras.layers.MaxPooling2D) pour réduire la taille de l'image. Indiquez en argument la taille du pooling (en général 2 est une valeur par défaut).
- Ne mettez que quelques couches de convolution (2 ou 3 devraient suffire).
- A la suite de la partie convolutive, applatissez la réponse grâce à une couche de Flatten, sans argument.
- Ensuite, vous pouvez remettre des couches Dense pour compléter le réseau, et finir par une dernière couche avec le nombre de neurones et la fonction d'activation adaptée.
- Vous pouvez ajouter des couches de BatchNormalization, Dropout et de la régularisation si vous le souhaitez.

In [None]:
#A COMPLETER


**Exercice** : Affichez la structure de votre modèle avec my_model.summary()

In [None]:
#A COMPLETER

**Vérification** : Pour l'instant, il suffit qu'il n'y ait pas d'erreur.

### Compilation du modèle

**Exercice** : Compilez le modèle avec l'optimizer que vous souhaitez. Mettez une loss function adaptée ainsi qu'une métrique adaptée.

In [None]:
#A COMPLETER

**Vérification** : De nouveau, s'il n'y a pas d'erreur et que vous avez suivi les instructions, tout devrait bien se passer.

### Mise en place de l'early stopping

**Exercice** : Définissez un early-stopping.

In [None]:
#A COMPLETER

## L'apprentissage

**Exercice** : Effectuez l'apprentissage avec un jeu de validation, des mini-batchs, l'early-stopping... et stockez l'historique dans une variable.

In [None]:
#A COMPLETER

**Vérification** : La loss function devrait diminuer et l'accuracy augmenter. De même pour le jeu de validation.

**Exercice** : Tracez l'évolution de la fonction de coût et de l'accuracy pour le jeu d'entraînement et pour le jeu de validation.

In [None]:
#A COMPLETER

## Prédictions avec le modèle

**Exercice** : Effectuez la prédiction sur le jeu de test.

In [None]:
#A COMPLETER

**Exercice** : Extrayez les labels prédits par votre réseau, qui correspondent aux classes avec la plus grande probabilité. La fonction np.argmax vous sera utile, à appliquer sur le bon "axis".

In [None]:
#A COMPLETER

**Exercice** : Calculez l'accuracy sur le jeu de test.

In [None]:
#A COMPLETER

Le code ci-dessous vous permet de visualiser quelques résultats pris au hasard sur la base de test.

In [None]:
r = np.random.randint(X_test.shape[0])

figure = plt.figure(figsize = (16,9))

ax1 = plt.subplot(121)
ax1.imshow(X_test[r,:,:,0],cmap = "hot")
plt.title("Prédiction du réseau : " + str(Y_test_pred_lab[r]) + "\n Vraie valeur : " + str(Y_test[r]))

ax2 = plt.subplot(122)
ax2.bar(np.arange(10),height = Y_pred_test[r],tick_label = np.arange(10))
plt.xlabel("Valeur")
plt.ylabel("Output du réseau")


**Exercice** : Réutilisez le code d'affichage ci-dessus, mais pour afficher aléatoirement des erreurs. La fonction np.where vous sera utile pour localiser les erreurs.

In [None]:
#A COMPLETER