# TP Programmation avec Keras - Cas MNIST, autoencodeur

Nous allons produire un réseau de neurones autoencodeur sur la base de données MNIST. L'objectif d'un autoencodeur est d'être capable, à l'aide de la première partie du réseau appelée encodeur, de réduire la dimension des données de manière non linéaire dans un espace appelé espace latent. C'est en quelques sortes une version non linéaire de l'analyse en composantes principales. La deuxième partie du réseau, appelée décodeur, reconstruit les données à partir de l'espace latent.

Dans ce TP, des cellules seront laissées à trous, il faudra les compléter suivant les consignes. Elles seront identifiées par le mot **Exercice**. Les **Vérifications** seront effectuées principalement par vous-mêmes, sur la bonne convergence des algorithmes ou leur bon fonctionnement.

Ci-dessous, on importe les bibliothèques qui seront utiles.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow.keras as keras
import tensorflow as tf

## Mise en place des données

Le code ci-dessous charge les données MNIST.

In [None]:
#NE PAS MODIFIER

(X_train, Y_train), (X_test, Y_test) = keras.datasets.mnist.load_data()

**Exercice** : Normalisez les données d'entrées en les divisant par 255. Ne vous occupez pas des données de sortie, nous n'en aurons pas besoin.

In [None]:
X_train = #A COMPLETER

X_test = #A COMPLETER

**Exercice** : Nous allons utiliser des couches de convolution à deux dimensions dans cet auto-encodeur. Adaptez les dimensions de X_train de façon à pouvoir utiliser ce type de couche (rappel : il faut trois dimensions).

In [None]:
X_train = #A COMPLETER

X_test = #A COMPLETER

## Modèle Keras

### Création du modèle auto-encodeur

**Exercice** : Créez un modèle avec Keras que vous appellerez "my_model".

**Instructions spécifiques** : 
- Utilisez deux/trois couches de convolution dans un premier temps avec des MaxPooling puis un couche de Flatten.
- Passez à deux/trois couches Dense.
- La dernière couche que vous aurez mise ici sera l'espace latent. Le nombre de neurones déterminera la dimension de l'espace latent. Essayez déjà avec deux neurones dans l'espace latent. Donnez-lui le nom "latent_space" avec le mot-clé name dans la couche Dense. Mettez une fonction d'activation "sigmoid" sur le latent_space.
- Faites ensuite la partie décodeur : c'est en quelque sorte un symétrique de l'encodeur.
- Remettez les couches Dense de manière symétrique.
- La dernière couche Dense devra comporter un nombre de neurones identique à ce que donne la première couche Flatten (utilisez model.summary() pour vous aider).
- Effectuez un reshape (keras.layers.Reshape()) dans laquelle vous indiquerez une dimension correspondant à celle des données avant la première couche Flatten.
- Appliquez le symétrique de vos première couches de convolution en remplaçant Conv2D par Conv2DTranspose et les MaxPooling2D par UpSampling2D (opération inverse du MaxPooling : cela augmente la dimension).
- La dimension de sortie devra être la même que la dimension d'entrée : cela signifie que la dernière couche Conv2DTranspose ne devra comporter qu'un seul neurone (un canal). Mettez une fonction d'activation sidgmoide en sortie de la dernière couche (comme on a normalisé les données d'entrée entre 0 et 1).

In [None]:
#A COMPLETER


**Exercice** : Affichez la structure de votre modèle avec my_model.summary()

In [None]:
#A COMPLETER

**Vérification** : Pour l'instant, il suffit qu'il n'y ait pas d'erreur. La dimension de la dernière couche doit être (None,28,28,1), la couche du milieu doit s'appeler "latent_space" et doit comporter 2 neurones (si vous avez choisi deux dimensions pour l'espace latent).

### Compilation du modèle

**Exercice** : Compilez le modèle avec l'optimizer que vous souhaitez. Ici la sortie correspondra aux images que nous aurons mises en entrée : on comparera donc la sortie du réseau de neurones aux images d'entrée. On peut utiliser une loss mean squared error ("mse") ou binary_cross_entropy. Il ne sera pas utile de mettre de métrique.

In [None]:
#A COMPLETER

**Vérification** : De nouveau, s'il n'y a pas d'erreur et que vous avez suivi les instructions, tout devrait bien se passer.

### Mise en place de l'early stopping

**Exercice** : Définissez un early-stopping.

In [None]:
#A COMPLETER

## L'apprentissage

**Exercice** : Effectuez l'apprentissage avec un jeu de validation, des mini-batchs, l'early-stopping... et stockez l'historique dans une variable. Attention, les données de sortie doivent être X_train ici, tout comme les données d'entrée !

In [None]:
#A COMPLETER

**Vérification** : La loss function devrait diminuer. De même pour le jeu de validation.

**Exercice** : Tracez l'évolution de la fonction de coût et de l'accuracy pour le jeu d'entraînement et pour le jeu de validation.

In [None]:
#A COMPLETER

## Prédictions avec le modèle

**Exercice** : Effectuez la prédiction sur le jeu de test. Notez-la X_pred_test.

In [None]:
#A COMPLETER

**Exercice** : Affichez ci-dessous un exemple de X_test et X_pred_test.

In [None]:
i = 3

plt.figure(figsize = (16,9))

plt.subplot(121)
plt.imshow(#A COMPLETER)
plt.title("Exemple original")

plt.subplot(122)
plt.imshow(#A COMPLETER)
plt.title("Exemple reconstruit")

Vous pourrez voir que les données ne sont pas parfaitement reconstruites : les dimensions de l'espace latent ne sont pas suffisantes pour reconstruire l'ensemble des données, mais cela devrait être déjà assez correct. Nous règlerons cela plus tard. Nous allons étudier un peu plus en détail cet espace latent.

## Représentation de l'espace latent

**Exercice** : Récupérez les sorties de l'espace latent. Pour ce faire, il faut créer un modèle spécifique qui fournit la sortie de l'espace latent. Complétez le code ci-dessous en donnant le nom de la couche que vous voulez extraire. Vous verrez ensuite que le modèle construit correspond à un modèle avec les mêmes inputs que votre autoencodeur, mais en sortie, il prend la couche de l'espace latent.

In [None]:
layer_name = #A COMPLETER
latent_space_model = keras.Model(inputs=my_model.input,
                                 outputs=my_model.get_layer(layer_name).output)


**Exercice** : Appliquez ce modèle aux données de test pour prédire les variables de l'espace latent associé.

In [None]:
latent_space_pred = #A COMPLETER

**Exercice** : On a choisi deux dimensions dans l'espace latent afin de pouvoir les représenter facilement visuellement. À l'aide de plt.scatter, affichez les points correspondant à l'espace latent. Donnez leur une couleur correspondant à leur label à l'aide de Y_test (mot-clé : c = Vecteur de couleurs).

In [None]:
plt.figure(figsize = (16,9))

plt.scatter(#A COMPLETER)
plt.colorbar()

Vous devriez observer que les points se rassemblent par clusters. Ils ne sont pas forcément très bien séparés mais ils sont visibles. Les 0 et 1 devraient par exemple être bien à l'écart des autres.

## Meilleure reconstruction

**Exercice** : Reprenez la structure de l'autoencodeur, mais changez la dimension de l'espace latent de sorte à mieux reconstruire les données avec votre autoencodeur. Une dimension de 10 devrait être suffisante. Donnez un nom à la couche qui suit celle de l'espace latent, par exemple "first_layer_decod". Relancez l'ensemble de l'apprentissage. 

In [None]:
#A COMPLETER

**Exercice** : Affichez les graphes des fonctions de coût.

In [None]:
#A COMPLETER

**Exercice** : Effectuez la prédiction sur vos données de test.

In [None]:
X_pred_test = #A COMPLETER

**Exercice** : Représentez quelques exemples que vous avez reconstruit et comparez-les aux exemples originaux.

In [None]:
#A COMPLETER

### Débruitage d'image

**Exercice** : Nous allons appliquer votre autoencodeur au débruitage d'image. Sélectionnez une image de test. Ajoutez-lui un bruit gaussien avec np.random.randn(), précisez la dimension du bruit à ajouter. Utilisez un écart-type de 0.1 pour commencer. Effectuez un np.clip sur votre image bruitée pour que les valeurs soient bien comprises entre 0 et 1. Enfin, appliquez-lui votre auto-encodeur. Vous pourrez vous amuser à modifier l'écart-type.

In [None]:
i = 6

image = X_test[i:(i+1)]

image_noisy = #A COMPLETER (appliquer bruit gaussien puis clip entre 0 et 1)

image_denoised = #A COMPLETER

plt.figure(figsize = (16,9))

plt.subplot(131)
plt.imshow(#A COMPLETER)
plt.title("Exemple original")

plt.subplot(132)
plt.imshow(#A COMPLETER)
plt.title("Image bruitée")

plt.subplot(133)
plt.imshow(#A COMPLETER)
plt.title("Image débruitée")

### Interpolation dans l'espace latent

**Exercice** : Complétez le code ci-dessous pour séparer la partie encodeur et décodeur.

In [None]:
layer_name = #A COMPLETER
encoder = keras.Model(inputs=my_model_2.input,
                                 outputs=my_model_2.get_layer(layer_name).output)

layer_name_2 = #A COMPLETER
decoder = keras.Model(inputs=my_model_2.get_layer(layer_name_2).input,
                                 outputs=my_model_2.output)

**Exercice** : Choisissez deux images et appliquez-leur la partie encodeur, sauvegardez les variables latente correspondantes. N'utilisez pas predict, appliquez directement encoder comme ceci : encoder(image).

In [None]:
i_1 = 0
i_2 = 102

image_1 = #A COMPLETER
image_2 = #A COMPLETER

lat_1 = #A COMPLETER
lat_2 = #A COMPLETER

**Exercice** : Effectuez une interpolation entre les variables latentes de la manière suivante : $lat_{interp} = (1 - \lambda lat_1) + \lambda lat_2$ avec $\lambda$ variant de 0 à 1 avec 10 de valeurs.

In [None]:
lambd = #A COMPLETER (créer un tenseur avec 10 éléments variant de 0 à 1, avec tf.linspace)


#CI-DESSOUS ON MODIFIE LES VECTEURS POUR QU'ILS AIENT LA MÊME DIMENSION
lambd = tf.cast(lambd,dtype = "float32")
lambd = tf.reshape(lambd,(10,1))
lambd = tf.repeat(lambd,10,axis = 1)
lat_1 = tf.repeat(lat_1,10,axis = 0)
lat_2 = tf.repeat(lat_2,10,axis = 0)

lat_interp = #A COMPLETER (appliquer la formule d'interpolation)

**Exercice** : Appliquez votre décodeur sur les variables lat_interp.

In [None]:
im_interp = #A COMPLETER

Ci-dessous, on représente les images interpolées par votre décodeur !

In [None]:
plt.figure(figsize = (10,5))

for i in range(10):
  plt.subplot(2,5,i+1)
  plt.imshow(im_interp[i,:,:,0])