vae/train.py

import os
import argparse
from datetime import datetime
import tensorflow as tf
import tensorflow_datasets as tfds

from model import VAE
from utils import PlotReconstructionCallback, PlotSamplesCallback

tfk = tf.keras
tfkl = tf.keras.layers
AUTOTUNE = tf.data.experimental.AUTOTUNE

# Parse arguments
parser = argparse.ArgumentParser()
parser.add_argument('-e', '--epochs', type=int, default=10, help='Number of training epochs')
parser.add_argument('-b', '--batch', type=int, default=64, help='Batch size for training')
parser.add_argument('-bf', '--buffer', type=int, default=1024, help='Buffer size for shuffling')
parser.add_argument('-kl', '--kl_weight', type=float, default=1e-4, help='Factor for the KL loss')

args = parser.parse_args()

# Training parameters
EPOCHS = args.epochs
BATCH_SIZE = args.batch
BUFFER_SIZE = args.buffer  # for shuffling

# Load dataset
mnist = tfds.load('mnist')
train_ds, test_ds = mnist['train'], mnist['test']

def prepare(element):
    image = element['image']
    image = tf.cast(image, tf.float32)
    image = image / 255.
    return image

# Autoencoder training requires target = input
def duplicate(element):
    return element, element

train_ds = (train_ds.shuffle(BUFFER_SIZE)
                    .batch(BATCH_SIZE)
                    .map(prepare, num_parallel_calls=AUTOTUNE)
                    .map(duplicate)
                    .prefetch(AUTOTUNE))

test_ds = (test_ds.batch(BATCH_SIZE)
                   .map(prepare, num_parallel_calls=AUTOTUNE)
                   .map(duplicate)
                   .prefetch(AUTOTUNE))

# Define MNIST encoder / decoder
encoder = tfk.Sequential([
    tfkl.Conv2D(filters=16, kernel_size=3, strides=2, padding='same', activation='relu'),
    tfkl.Conv2D(filters=32, kernel_size=3, strides=2, padding='same', activation='relu'),
    tfkl.Flatten(),
    tfkl.Dense(units=2 * 10),  # no activation
])

decoder = tfk.Sequential([
    tfkl.Dense(units=7*7*32, activation='relu'),
    tfkl.Reshape(target_shape=(7, 7, 32)),
    tfkl.Conv2DTranspose(filters=16, kernel_size=3, strides=2, padding='same', activation='relu'),
    tfkl.Conv2DTranspose(filters=1, kernel_size=3, strides=2, padding='same'),  # no activation
])

# Define model
model = VAE(encoder, decoder, args.kl_weight)
model.compile(optimizer='adam', loss='mse')

# Callbacks
time = datetime.now().strftime('%Y%m%d-%H%M%S')
log_dir = os.path.join('.', 'logs', 'vae', time)
tensorboard_clbk = tfk.callbacks.TensorBoard(log_dir=log_dir)
plot_clbk = PlotReconstructionCallback(logdir=log_dir, test_ds=test_ds, nex=4)
samples_clbk = PlotSamplesCallback(logdir=log_dir, nex=4)
callbacks = [tensorboard_clbk, plot_clbk, samples_clbk]

# Fit
model.fit(train_ds, validation_data=test_ds, epochs=EPOCHS, callbacks=callbacks)