# TP Programmation avec Keras - Cas XOR

Maintenant, nous allons produire un réseau de neurones pour effectuer une classification sur le cas XOR, en utilisant les bibliothèques tensorflow/keras.

Dans ce TP, des cellules seront laissées à trous, il faudra les compléter suivant les consignes. Elles seront identifiées par le mot **Exercice**. Les **Vérifications** seront effectuées principalement par vous-mêmes, sur la bonne convergence des algorithmes ou leur bon fonctionnement.

Ci-dessous, on importe les bibliothèques qui seront utiles.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow.keras as keras

## Mise en place des données

Nous allons nous intéresser au problème du XOR (ou exclusif). Prenons des vecteurs à deux dimensions. Si les deux coordonnées ont le même signe, on dira que le vecteur appartient à la classe 1, et 0 si les deux coordonnées sont de signes opposés. En exercice, vous pouvez faire un dessin représentant la situation. On comprend ici qu'un séparateur linéaire ne permettra pas de séparer les deux classes. Nous allons faire un réseau de neurones pour cela. Ci-dessous, je vous construis une base de données.

Exécutez la cellule ci-dessous pour créer les données. N'hésitez pas à les visualiser.

In [None]:
#NE PAS MODIFIER

N_train = 200

X_train = 2*np.random.rand(N_train,2) - 1

Y_train = (np.sign(X_train[:,0]) == np.sign(X_train[:,1]))*1

Y_train = np.reshape(Y_train,(N_train,1))

N_test = 100

X_test = 2*np.random.rand(N_test,2) - 1

Y_test = (np.sign(X_test[:,0]) == np.sign(X_test[:,1]))*1

Y_test = np.reshape(Y_test,(N_test,1))

## Modèle Keras

### Création du modèle

**Exercice** : Créez un modèle avec Keras que vous appellerez "my_model". Construisez-le de sorte à ce qu'il ait 3 couches Dense (fully-connected) de 5, 5 et 1 neurones respectivement. Les 2 premières couches doivent avoir une fonction d'activation ReLU et celle de la dernière couche sera sigmoïde.

**Hints** :
- Initialisez le modèle avec keras.Sequential
- Pour ajouter une couche, utilisez my_model.add(LAYER)
- Vous trouverez les layers en utilisant keras.layers.Dense, il faut mettre en argument le nombre de neurones et la fonction d'activation.
- Pour la première couche, précisez la taille de l'input avec le mot-clé input_shape : ici elle est de la forme (2,). Il faut bien mettre la virgule qui peut paraître inutile.

In [None]:
my_model = #A COMPLETER

#COMPLETEZ AVEC LA STRUCTURE EN SUIVANT LES INSTRUCTIONS

**Exercice** : Affichez la structure de votre modèle avec my_model.summary()

In [None]:
#A COMPLETER

**Vérification** : Pour l'instant, il suffit qu'il n'y ait pas d'erreur.

### Compilation du modèle

**Exercice** : Il faut maintenant compiler le modèle, en indiquant la fonction de coût à utiliser, les différentes métriques à utiliser, ainsi que l'optimizer que vous souhaitez utiliser ainsi que le learning rate ou encore d'autre paramètres propres à l'optimizer.

**Hints** :
- Définissez déjà l'optimizer dans la variable opt. Utilisez l'optimizer Adam que vous trouverez dans keras.optimizers.Adam. Précisez le learning rate avec le mot-clé lr, et utilisez un learning rate de 0.01.
- Utilisez ensuite my_model.compile en précisant :
    - l'optimizer avec le mot-clé optimizer, et lui donnant la variable opt créée précédemment
    - la fonction de coût avec le mot-clé loss. On utilise la binary cross entropy que l'on appelle avec la chaîne de caractères "binary_crossentropy"
    - la métrique avec le mot-clé metrics. Il faut fournir une liste contenant les métriques d'intérêt. Ici utilisez une liste qui ne contient que la métrique "binary_accuracy" qui correspond au taux de bonnes réponses de votre réseau de neurones (avec un seuil de 0.5). Vous verrez cette métrique être évaluée au cours de l'apprentissage sur le jeu d'entraînement.

In [None]:
opt = #A COMPLETER

#COMPLETEZ PAR MY_MODEL.COMPILE

**Vérification** : De nouveau, s'il n'y a pas d'erreur et que vous avez suivi les instructions, tout devrait bien se passer.

## L'apprentissage

**Exercice** : Il faut maintenant effectuer l'apprentissage !

**Hints** :
- Utilisez my_model.fit en donnant les arguments suivant :
    - D'abord les entrées du jeu d'entraînement X_train
    - Puis les sorties Y_train
    - Le nombre d'époques avec le mot-clé epochs. Une centaine d'époques devraient suffire
- Stockez l'apprentissage dans la variable learning (learning = model.fit(...)). Cela permettra a posteriori de récupérer des informations sur l'apprentissage (l'évolution de la loss ou de la métrique par exemple).

In [None]:
learning = #A COMPLETER

**Vérification** : La loss function devrait diminuer et l'accuracy augmenter.

**Exercice** : On va tracer l'évolution de la fonction de coût et de l'accuracy. Complétez le code ci-dessous. Vous trouverez la fonction de coût dans learning.history["loss"] et l'accuracy dans learning.history["binary_accuracy"].

In [None]:
loss_evolution = #A COMPLETER
acc_evolution = #A COMPLETER

plt.figure(figsize = (16,9))
plt.subplot(121)
plt.plot(loss_evolution)
plt.xlabel("Epoques")
plt.ylabel("Valeur de la fonction de coût")
plt.title("Loss function evolution")

plt.subplot(122)
plt.plot(acc_evolution)
plt.xlabel("Epoques")
plt.ylabel("Valeur de l'accuracy")
plt.title("Binary accuracy evolution")

Vous pourrez peut-être vous dire qu'on aurait pu continuer l'apprentissage, la fonction de coût peut sembler vouloir continuer de diminuer. Je vous inviterai à relancer votre modèle avec beaucoup plus d'époques (1000 ou même plus) et voir l'effet que cela a sur l'accuracy du jeu d'apprentissage, ainsi que sur votre jeu de test.

## Prédictions avec le modèle

**Exercice** : Nous allons maintenant faire une prédiction sur le jeu de test. Il suffit d'utiliser my_model.predict appliqué sur le jeu de test X_test. Stockez cette prédiction dans la variable Y_pred_test.

In [None]:
Y_pred_test = #A COMPLETER

Ci dessous, vous trouverez la précision sur le jeu de test, ainsi que sur le jeu d'entraînement : on se fixe un seuil de 0.5, si la prédiction est supérieure à 0.5, on l'associe à la classe 1, et à la classe 0 sinon. On compte le nombre de fois où la classe prédite est égale à la classe attendue et on regarde par rapport au nombre d'exemples.

In [None]:
print("Accuracy sur le jeu de test : " + str(np.sum((Y_pred_test > 0.5) == Y_test)/N_test))

Ci-dessous pour visualiser vos prédictions sur l'ensemble du carré unité en deux dimensions !

In [None]:
grid = np.meshgrid(np.linspace(-1.,1.,50),np.linspace(-1,1,50))

X_test_new = np.array([grid[0].flatten(),grid[1].flatten()])

Y_pred_new = my_model.predict(X_test_new.T)

maps = plt.imshow((Y_pred_new.reshape(grid[0].shape[0],grid[0].shape[1])),extent = (-1,1,-1,1),cmap = "hot",origin = "lower")
plt.scatter(X_test[:,0],X_test[:,1],color = "blue",marker = "x")
plt.colorbar(maps, label = "Sortie du réseau de neurones")