Descente du gradient stochastique [Utilisation de TensorFlow 2.0]

Descente du gradient stochastique

Remarque : Battre les cartes

Les données sont rangées dans l'ordre fixé dans les tableaux x et y. Plutôt que de parcourir les données dans l'ordre de x et y, on peut mélanger les données. L'algorithme s'appelle alors descente du gradient stochastique.

Exemple : Mélanger les données : méthode shuffle

Par rapport au programme précédent, la ligne :

dataset = dataset.repeat( num_epochs ).batch( batch_size )

a été modifiée en

dataset = dataset.shuffle(500).repeat( num_epochs ).batch( batch_size )

import tensorflow as tf
import numpy as np
class Model(object):
    def __init__(self, a, b):
        self.a = a
        self.b = b
    def __call__(self, x):
        return self.a * x + self.b
def train(model, inputs, outputs, learning_rate):
    with tf.GradientTape() as t:
        t.watch([model.a, model.b])
        current_loss = perte(model(inputs), outputs)
    da, db = t.gradient(current_loss, [model.a, model.b])
    model.a = tf.add(model.a,tf.constant(-learning_rate * da))
    model.b = tf.add(model.b,tf.constant(-learning_rate * db))
        
def perte(predicted_y, target_y):
    return tf.reduce_mean(tf.square(predicted_y - target_y))
    
x = np.array([1, 5, 8, 9 ,10, 15,13, 3,-2],np.float32)
y = np.array([-2,-5, -7, -12 ,-15, -5, -12,-10,-5],np.float32)
nombre_donnees = x.shape[0]
dataset = tf.data.Dataset.from_tensor_slices(( x , y ))
batch_size = 2
num_epochs = 2
dataset = dataset.shuffle(500).repeat( num_epochs ).batch( batch_size )
iterator = dataset.__iter__() 
learning_rate = 0.01
nbre_lot = nombre_donnees // batch_size
model = Model(tf.Variable(7.3),tf.Variable(5.5))
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')
print('Perte: ', perte(model(x), y).numpy())
for epoch in range(num_epochs):
    for i in range(nbre_lot):
        print("**************  Epoque,lot : ",epoch,'//',i)
        x_batch , y_batch = iterator.get_next()
        print('Donnees ajustees :', x_batch,'/',y_batch)
        train(model, x_batch, y_batch, learning_rate)
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')
print('Perte: ', perte(model(x), y).numpy())

import tensorflow as tf
import numpy as np

class Model(object):
    def __init__(self, a, b):
        self.a = a
        self.b = b
    def __call__(self, x):
        return self.a * x + self.b

def train(model, inputs, outputs, learning_rate):
    with tf.GradientTape() as t:
        t.watch([model.a, model.b])
        current_loss = perte(model(inputs), outputs)
    da, db = t.gradient(current_loss, [model.a, model.b])
    model.a = tf.add(model.a,tf.constant(-learning_rate * da))
    model.b = tf.add(model.b,tf.constant(-learning_rate * db))
        
def perte(predicted_y, target_y):
    return tf.reduce_mean(tf.square(predicted_y - target_y))

    
x = np.array([1, 5, 8, 9 ,10, 15,13, 3,-2],np.float32)
y = np.array([-2,-5, -7, -12 ,-15, -5, -12,-10,-5],np.float32)
nombre_donnees = x.shape[0]
dataset = tf.data.Dataset.from_tensor_slices(( x , y ))

batch_size = 2
num_epochs = 2
dataset = dataset.shuffle(500).repeat( num_epochs ).batch( batch_size )
iterator = dataset.__iter__() 
learning_rate = 0.01
nbre_lot = nombre_donnees // batch_size
model = Model(tf.Variable(7.3),tf.Variable(5.5))

print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')
print('Perte: ', perte(model(x), y).numpy())


for epoch in range(num_epochs):
    for i in range(nbre_lot):
        print("**************  Epoque,lot : ",epoch,'//',i)
        x_batch , y_batch = iterator.get_next()
        print('Donnees ajustees :', x_batch,'/',y_batch)
        train(model, x_batch, y_batch, learning_rate)
print('(a, b) : (', model.a.numpy(),', ',model.b.numpy(),')')
print('Perte: ', perte(model(x), y).numpy())

L'ordre de parcours des données est changé, les lots ne sont plus les mêmes.