Régression linéaire en utilisant tensorflow [Utilisation de TensorFlow 2.0]

Régression linéaire en utilisant tensorflow

Remarque :

Cet exemple est dans la documentation de TensorFlow .

Cet exemple est décrit dans cette vidéo (de 19m33s à 27m53s).

Régression linéaire avec tensorflow 2.0 en utilisant GradientTape

Méthode : Écrire un programme en TensorFlow

Le programme que nous allons écrire utilise tensorflow et est écrit en python.

Exemple : Régression linéaire

Un modèle de régression linéaire est un modèle de régression qui cherche à établir une relation linéaire entre une variable y, dite expliquée, et une ou plusieurs variables x, dites explicatives : On parle aussi de modèle linéaire ou de modèle de régression linéaire.

import tensorflow as tf
import numpy as np
class Model(object):
    def __init__(self, a, b):
        self.a = a
        self.b = b
    def __call__(self, x):
        return self.a * x + self.b
def train(model, inputs, outputs, learning_rate):
    with tf.GradientTape() as t:
        t.watch([model.a, model.b])
        current_loss = perte(model(inputs), outputs)
    da, db = t.gradient(current_loss, [model.a, model.b])
    model.a = tf.add(model.a,tf.constant(-learning_rate * da))
    model.b = tf.add(model.b,tf.constant(-learning_rate * db))
def perte(predicted_y, target_y):
    return tf.reduce_mean(tf.square(predicted_y - target_y))
  
a_mc2 = tf.Variable(2.3)
b_mc2 = tf.Variable(0.5)
model_ref = Model(a_mc2,b_mc2)
x = np.array([1,2,3,4],np.float32)
y = np.array([3,5,7,10],np.float32)
learning_rate = 0.005
model = Model(tf.Variable(7.3),tf.Variable(5.5))
print('Perte: ', perte(model(x), y).numpy())
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')
epochs = range(1000)
for epoch in epochs:
    train(model, x, y, learning_rate)
print('Perte: ', perte(model(x), y).numpy())
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')

import tensorflow as tf
import numpy as np

class Model(object):
    def __init__(self, a, b):
        self.a = a
        self.b = b
    def __call__(self, x):
        return self.a * x + self.b

def train(model, inputs, outputs, learning_rate):
    with tf.GradientTape() as t:
        t.watch([model.a, model.b])
        current_loss = perte(model(inputs), outputs)
    da, db = t.gradient(current_loss, [model.a, model.b])
    model.a = tf.add(model.a,tf.constant(-learning_rate * da))
    model.b = tf.add(model.b,tf.constant(-learning_rate * db))

def perte(predicted_y, target_y):
    return tf.reduce_mean(tf.square(predicted_y - target_y))
  

a_mc2 = tf.Variable(2.3)
b_mc2 = tf.Variable(0.5)
model_ref = Model(a_mc2,b_mc2)
x = np.array([1,2,3,4],np.float32)
y = np.array([3,5,7,10],np.float32)
learning_rate = 0.005

model = Model(tf.Variable(7.3),tf.Variable(5.5))

print('Perte: ', perte(model(x), y).numpy())
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')

epochs = range(1000)
for epoch in epochs:
    train(model, x, y, learning_rate)
print('Perte: ', perte(model(x), y).numpy())
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')

a et b sont les deux paramètres du modèle (variable), on utilise tf.Variable avec un dtype float (32 bits) par défaut.

Les données x et y sont des tableaux numpy.

La fonction de perte permet de mesurer l'écart entre le modèle et les données. On utilise simplement l'erreur des moindres carrés :

\(\sum_{i=0}^{N-1}(y_i-ax_i-b)^2\)

def perte(predicted_y, target_y):
    return tf.reduce_mean(tf.square(predicted_y - target_y))

def perte(predicted_y, target_y):
    return tf.reduce_mean(tf.square(predicted_y - target_y))

La fonction train ajuste les paramètres a et b du modèle :

def train(model, inputs, outputs, learning_rate):
    with tf.GradientTape() as t:
        t.watch([model.a, model.b])
        current_loss = perte(model(inputs), outputs)
    da, db = t.gradient(current_loss, [model.a, model.b])
    model.a = tf.add(model.a,tf.constant(-learning_rate * da))
    model.b = tf.add(model.b,tf.constant(-learning_rate * db))

def train(model, inputs, outputs, learning_rate):
    with tf.GradientTape() as t:
        t.watch([model.a, model.b])
        current_loss = perte(model(inputs), outputs)
    da, db = t.gradient(current_loss, [model.a, model.b])
    model.a = tf.add(model.a,tf.constant(-learning_rate * da))
    model.b = tf.add(model.b,tf.constant(-learning_rate * db))

Le calcul du gradient est effectué par la classe tf.GradientTape et la méthode t.gradient

    with tf.GradientTape() as t:
        t.watch([model.a, model.b])
        current_loss = perte(model(inputs), outputs)
    da, db = t.gradient(current_loss, [model.a, model.b])

    with tf.GradientTape() as t:
        t.watch([model.a, model.b])
        current_loss = perte(model(inputs), outputs)
    da, db = t.gradient(current_loss, [model.a, model.b])

Pour calculer la valeur du sortie du modèle, on appelle la méthode __call__ (associée à l'opérateur ()) de l'objet avec en paramètre l'entrée du modèle:

model(x)

model(x)

Exemple : Exemple avec le tracé de la descente du gradient

import tensorflow as tf
import numpy as np
import matplotlib as mpl
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import pyplot as plt
class Model(object):
    def __init__(self, a, b):
        self.a = a
        self.b = b
    def __call__(self, x):
        return self.a * x + self.b
def train(model, inputs, outputs, learning_rate):
    with tf.GradientTape() as t:
        t.watch([model.a, model.b])
        current_loss = perte(model(inputs), outputs)
    da, db = t.gradient(current_loss, [model.a, model.b])
    model.a = tf.add(model.a,tf.constant(-learning_rate * da))
    model.b = tf.add(model.b,tf.constant(-learning_rate * db))
        
        
model = Model(tf.Variable(3.0),tf.Variable(5.0))
assert model(3.0).numpy() == 14.0
def perte(predicted_y, target_y):
    return tf.reduce_mean(tf.square(predicted_y - target_y))
  
a_mc2 = tf.Variable(2.3)
b_mc2 = tf.Variable(0.5)
model_ref = Model(a_mc2,b_mc2)
x = np.array([1,2,3,4],np.float32)
y = np.array([3,5,7,10],np.float32)
NUM_EXAMPLES = x.shape
learning_rate = 0.005
model = Model(tf.Variable(7.3),tf.Variable(5.5))
print('Perte: ', perte(model(x), y).numpy())
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')
chemin = list()
epochs = range(1000)
for epoch in epochs:
    train(model, x, y, learning_rate)
    chemin.append([model.a.numpy(), model.b.numpy(),perte(model(x), y)])
print('Perte: ', perte(model(x), y).numpy())
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')
aa = np.arange(-5 + model.a.numpy(), 5 + model.a.numpy(), 0.05)
bb = np.arange(-5 + model.b.numpy(), 5 + model.b.numpy(), 0.05)
a_, b_ = np.meshgrid(aa, bb)
zz = np.zeros(a_.shape,np.float32)
for idx in range(x.shape[0]):
    zz = zz + (a_ * x[idx] + b_ - y[idx]) ** 2
plt.figure(1)
plt.scatter(x, y, c='b',label='Donnees')
plt.plot(x, model_ref(x), c='r',label='Droite des moindres carres')
plt.plot(x, model( x) , c='g',label='descente de gradient')
plt.scatter(x, y, c='r')
plt.legend()
fig = plt.figure(2)
ax = fig.gca(projection='3d')
surf = ax.plot_wireframe(a_, b_, zz/x.shape[0],
                       rstride=10, cstride=10)
ax.plot([x[0] for x in chemin], [x[1] for x in chemin], [x[2] for x in chemin], label='gradient descendant')
ax.scatter([x[0] for x in chemin], [x[1] for x in chemin], [x[2] for x in chemin],c='r')
ax.legend()
plt.show()

import tensorflow as tf
import numpy as np
import matplotlib as mpl
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import pyplot as plt

class Model(object):
    def __init__(self, a, b):
        self.a = a
        self.b = b
    def __call__(self, x):
        return self.a * x + self.b

def train(model, inputs, outputs, learning_rate):
    with tf.GradientTape() as t:
        t.watch([model.a, model.b])
        current_loss = perte(model(inputs), outputs)
    da, db = t.gradient(current_loss, [model.a, model.b])
    model.a = tf.add(model.a,tf.constant(-learning_rate * da))
    model.b = tf.add(model.b,tf.constant(-learning_rate * db))

        
        
model = Model(tf.Variable(3.0),tf.Variable(5.0))

assert model(3.0).numpy() == 14.0

def perte(predicted_y, target_y):
    return tf.reduce_mean(tf.square(predicted_y - target_y))
  

a_mc2 = tf.Variable(2.3)
b_mc2 = tf.Variable(0.5)
model_ref = Model(a_mc2,b_mc2)
x = np.array([1,2,3,4],np.float32)
y = np.array([3,5,7,10],np.float32)
NUM_EXAMPLES = x.shape
learning_rate = 0.005

model = Model(tf.Variable(7.3),tf.Variable(5.5))

print('Perte: ', perte(model(x), y).numpy())
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')


chemin = list()
epochs = range(1000)
for epoch in epochs:
    train(model, x, y, learning_rate)
    chemin.append([model.a.numpy(), model.b.numpy(),perte(model(x), y)])
print('Perte: ', perte(model(x), y).numpy())
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')

aa = np.arange(-5 + model.a.numpy(), 5 + model.a.numpy(), 0.05)
bb = np.arange(-5 + model.b.numpy(), 5 + model.b.numpy(), 0.05)
a_, b_ = np.meshgrid(aa, bb)
zz = np.zeros(a_.shape,np.float32)
for idx in range(x.shape[0]):
    zz = zz + (a_ * x[idx] + b_ - y[idx]) ** 2
plt.figure(1)
plt.scatter(x, y, c='b',label='Donnees')
plt.plot(x, model_ref(x), c='r',label='Droite des moindres carres')
plt.plot(x, model( x) , c='g',label='descente de gradient')
plt.scatter(x, y, c='r')
plt.legend()
fig = plt.figure(2)
ax = fig.gca(projection='3d')
surf = ax.plot_wireframe(a_, b_, zz/x.shape[0],
                       rstride=10, cstride=10)
ax.plot([x[0] for x in chemin], [x[1] for x in chemin], [x[2] for x in chemin], label='gradient descendant')
ax.scatter([x[0] for x in chemin], [x[1] for x in chemin], [x[2] for x in chemin],c='r')
ax.legend()
plt.show()