Refactored layer generators

benjaminbillet · benjaminbillet · commit 02ebbd3ab62c · 2019-07-19T14:56:04.000+02:00
diff --git a/styletransfer/generate-content-layer-outputs.ipynb b/styletransfer/generate-content-layer-outputs.ipynb
@@ -15,24 +15,16 @@
     "mpl.rcParams['figure.figsize'] = (12,12)\n",
     "mpl.rcParams['axes.grid'] = False\n",
     "\n",
-    "import time\n",
-    "import IPython.display as display\n",
+    "from util import imshow, load_img, save_img, apply_lum, match_lum\n",
+    "from model import StyleTransferModel\n",
+    "from losses import content_loss\n",
+    "from train import train\n",
     "\n",
-    "from util import imshow, load_img, save_img\n",
-    "from model import StyleTransferModel, print_stats\n",
-    "from losses import clip_0_1, content_loss\n",
+    "# https://www.positive.news/wp-content/uploads/2019/03/feat-1800x0-c-center.jpg\n",
+    "content_path = tf.keras.utils.get_file('forest.jpg','file:///home/jupyter/pictures/forest.jpg')\n",
     "\n",
-    "# load input images\n",
-    "content_path = tf.keras.utils.get_file('neckarfront.jpg','https://upload.wikimedia.org/wikipedia/commons/0/00/Tuebingen_Neckarfront.jpg')\n",
-    "style_path = tf.keras.utils.get_file('starry-night.jpg','https://upload.wikimedia.org/wikipedia/commons/thumb/e/ea/Van_Gogh_-_Starry_Night_-_Google_Art_Project.jpg/1280px-Van_Gogh_-_Starry_Night_-_Google_Art_Project.jpg')\n",
-    "content_image = load_img(content_path)\n",
-    "style_image = load_img(style_path)\n",
-    "\n",
-    "plt.subplot(1, 2, 1)\n",
-    "imshow(content_image, 'Content Image')\n",
-    "\n",
-    "plt.subplot(1, 2, 2)\n",
-    "imshow(style_image, 'Style Image')\n",
+    "content_img = load_img(content_path, max_dim=512)\n",
+    "imshow(content_img, 'Content Image')\n",
     "\n",
     "plt.show()"
    ]
@@ -45,53 +37,40 @@
    "source": [
     "# reconstruct content, for every layer\n",
     "content_layers = ['block1_conv1',\n",
-    "                    'block2_conv1',\n",
-    "                    'block3_conv1', \n",
-    "                    'block4_conv1', \n",
-    "                    'block5_conv1']\n",
-    "\n",
-    "opt = tf.optimizers.Adam(learning_rate=0.02, beta_1=0.99, epsilon=1e-1)\n",
+    "                  'block2_conv1',\n",
+    "                  'block3_conv1', \n",
+    "                  'block4_conv1', \n",
+    "                  'block5_conv1']\n",
     "\n",
     "for content_layer in content_layers:\n",
     "    extractor = StyleTransferModel(['block1_conv1'], [content_layer])\n",
-    "    results = extractor(tf.constant(content_image))\n",
     "\n",
-    "    # the variable to optimize\n",
-    "    image = tf.Variable(tf.random.uniform(content_image.shape))\n",
+    "    content_targets = extractor(content_img)['content']\n",
+    "    content_weights = [1.0]\n",
+    "\n",
+    "    # initialize the gradients with random noise\n",
+    "    initial_gradients = tf.Variable(tf.random.uniform(content_img.shape))\n",
     "\n",
-    "    content_targets = extractor(content_image)['content']\n",
-    "    content_weights = tf.constant([ 1e10 ])\n",
-    "    \n",
-    "    @tf.function()\n",
-    "    def train_step(image):\n",
-    "      with tf.GradientTape() as tape:\n",
+    "    def loss_func(image):\n",
     "        outputs = extractor(image)\n",
     "        loss = content_loss(outputs['content'], content_targets, content_weights)\n",
+    "        return loss\n",
     "\n",
-    "      grad = tape.gradient(loss, image)\n",
-    "      opt.apply_gradients([(grad, image)])\n",
-    "      image.assign(clip_0_1(image))\n",
-    "\n",
-    "    start = time.time()\n",
-    "\n",
-    "    epochs = 20\n",
-    "    steps_per_epoch = 100\n",
-    "\n",
-    "    step = 0\n",
-    "    for n in range(epochs):\n",
-    "      for m in range(steps_per_epoch):\n",
-    "        step += 1\n",
-    "        train_step(image)\n",
-    "        print(\".\", end='')\n",
-    "      display.clear_output(wait=True)\n",
-    "      imshow(image.read_value())\n",
-    "      plt.title(\"Train step: {}\".format(step))\n",
-    "      plt.show()\n",
-    "\n",
-    "    end = time.time()\n",
-    "    print(\"Total time: {:.1f}\".format(end-start))\n",
+    "    result = train(loss_func, extractor, initial_gradients, epochs=20)\n",
     "\n",
-    "    save_img(image[0], 'content_{}.png'.format(content_layer))"
+    "    save_img(result[0], 'content_{}.png'.format(content_layer))"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "for i, content_layer in enumerate(content_layers):\n",
+    "    plt.subplot(3, 2, i+1)\n",
+    "    img = load_img('output/content_{}.png'.format(content_layer), max_dim=512)\n",
+    "    imshow(result, 'Content Layer {}'.format(content_layer))"
    ]
   },
   {
diff --git a/styletransfer/generate-style-layer-outputs.ipynb b/styletransfer/generate-style-layer-outputs.ipynb
@@ -15,24 +15,16 @@
     "mpl.rcParams['figure.figsize'] = (12,12)\n",
     "mpl.rcParams['axes.grid'] = False\n",
     "\n",
-    "import time\n",
-    "import IPython.display as display\n",
+    "from util import imshow, load_img, save_img, apply_lum, match_lum\n",
+    "from model import StyleTransferModel\n",
+    "from losses import style_loss\n",
+    "from train import train\n",
     "\n",
-    "from util import imshow, load_img, save_img\n",
-    "from model import StyleTransferModel, print_stats\n",
-    "from losses import clip_0_1, style_loss\n",
+    "# https://images1.novica.net/pictures/10/p348189_2a.jpg, https://www.novica.com/p/impressionist-painting-in-delod-pangkung/348189/\n",
+    "style_path = tf.keras.utils.get_file('impressionist-bali.jpg','file:///home/jupyter/pictures/impressionist-bali.jpg')\n",
     "\n",
-    "# load input images\n",
-    "content_path = tf.keras.utils.get_file('neckarfront.jpg','https://upload.wikimedia.org/wikipedia/commons/0/00/Tuebingen_Neckarfront.jpg')\n",
-    "style_path = tf.keras.utils.get_file('starry-night.jpg','https://upload.wikimedia.org/wikipedia/commons/thumb/e/ea/Van_Gogh_-_Starry_Night_-_Google_Art_Project.jpg/1280px-Van_Gogh_-_Starry_Night_-_Google_Art_Project.jpg')\n",
-    "content_image = load_img(content_path)\n",
-    "style_image = load_img(style_path)\n",
-    "\n",
-    "plt.subplot(1, 2, 1)\n",
-    "imshow(content_image, 'Content Image')\n",
-    "\n",
-    "plt.subplot(1, 2, 2)\n",
-    "imshow(style_image, 'Style Image')\n",
+    "style_img = load_img(style_path, max_dim=512)\n",
+    "imshow(style_img, 'Style Image')\n",
     "\n",
     "plt.show()"
    ]
@@ -51,58 +43,25 @@
     "                'block5_conv1']\n",
     "\n",
     "\n",
-    "opt = tf.optimizers.Adam(learning_rate=0.02, beta_1=0.99, epsilon=1e-1)\n",
-    "\n",
     "for idx in range(len(style_layers)):\n",
     "    extractor = StyleTransferModel(style_layers[:idx+1], ['block1_conv1'])\n",
-    "    results = extractor(tf.constant(style_image))\n",
     "\n",
-    "    # the variable to optimize\n",
-    "    image = tf.Variable(tf.random.uniform(style_image.shape))\n",
-    "\n",
-    "    style_targets = extractor(style_image)['style']\n",
-    "\n",
-    "    # style_weights = [ 1e3/n**2 for n in [64, 128, 256, 512, 512] ]\n",
+    "    style_targets = extractor(style_img)['style']\n",
     "    style_weights = [ 1.0, 1.0, 1.0, 1.0, 1.0 ]\n",
-    "\n",
     "    style_weights = style_weights[:idx+1]\n",
+    "    style_weights = [ w/sum(style_weights) for w in style_weights ] # normalize weights\n",
     "\n",
-    "    # the weights are normalized\n",
-    "    style_weights = [ w/sum(style_weights) for w in style_weights ]\n",
-    "    style_weights = tf.constant(style_weights)\n",
+    "    # initialize the gradients with random noise\n",
+    "    initial_gradients = tf.Variable(tf.random.uniform(style_img.shape))\n",
     "\n",
-    "\n",
-    "    @tf.function()\n",
-    "    def train_step(image):\n",
-    "      with tf.GradientTape() as tape:\n",
+    "    def loss_func(image):\n",
     "        outputs = extractor(image)\n",
-    "        total_loss = style_loss(outputs['style'], style_targets, style_weights)\n",
-    "\n",
-    "      grad = tape.gradient(total_loss, image)\n",
-    "      opt.apply_gradients([(grad, image)])\n",
-    "      image.assign(clip_0_1(image))\n",
-    "\n",
-    "    start = time.time()\n",
-    "\n",
-    "    epochs = 20\n",
-    "    steps_per_epoch = 100\n",
-    "\n",
-    "    step = 0\n",
-    "    for n in range(epochs):\n",
-    "      for m in range(steps_per_epoch):\n",
-    "        step += 1\n",
-    "        train_step(image)\n",
-    "        print(\".\", end='')\n",
-    "      display.clear_output(wait=True)\n",
-    "      imshow(image.read_value())\n",
-    "      plt.title(\"Train step: {}\".format(step))\n",
-    "      print(style_layers[:idx+1])\n",
-    "      plt.show()\n",
+    "        loss = style_loss(outputs['style'], style_targets, style_weights)\n",
+    "        return loss\n",
     "\n",
-    "    end = time.time()\n",
-    "    print(\"Total time: {:.1f}\".format(end-start))\n",
+    "    result = train(loss_func, extractor, initial_gradients, epochs=20)\n",
     "\n",
-    "    save_img(image[0], 'style_{}.png'.format(style_layers[idx]))"
+    "    save_img(result[0], 'style_{}.png'.format(style_layers[idx]))"
    ]
   },
   {