models.py

import torch
import torch.nn as nn


class SRCNN(nn.Module):
    """
    Basic benchmark model, paper introducing the model is
    http://personal.ie.cuhk.edu.hk/~ccloy/files/eccv_2014_deepresolution.pdf
    """
    def __init__(self, latent_dim=[64, 32], input_dim=(251, 61),
                 output_dim=(251, 301)):
        super(SRCNN, self).__init__()
        self.output_dim = output_dim

        self.sequence = nn.Sequential(
            nn.Conv2d(1, latent_dim[0], 9, padding=4),
            nn.ReLU(),
           # nn.BatchNorm2d(latent_dim[0]),

            nn.Conv2d(latent_dim[0], latent_dim[1], 1, padding=0),
            nn.ReLU(),
            #nn.BatchNorm2d(latent_dim[1]),

            nn.Conv2d(latent_dim[1], 1, 5, padding=2),
        )

    def forward(self, x):
        x_upscaled = nn.functional.interpolate(x, size=self.output_dim)

        return self.sequence(x_upscaled) + x_upscaled


class VDSR(nn.Module):
    def __init__(self, latent_dim=256, n_blocks=5, output_dim=[251, 121]):
        super(VDSR, self).__init__()
        self.output_dim = output_dim
        kernel_size = 3

        # blocks
        self.blocks = nn.Sequential()

        for block in range(n_blocks):
            if block == 0:
                self.blocks.add_module(
                    "Conv {}".format(block),
                    nn.Conv2d(1, latent_dim, kernel_size, stride=1, padding=1))
            else:
                self.blocks.add_module(
                    "Conv {}".format(block),
                    nn.Conv2d(latent_dim, latent_dim, kernel_size, stride=1,
                              padding=1))
            self.blocks.add_module("ReLU {}".format(block), nn.ReLU())
        # last convolution
        self.conv_last = nn.Conv2d(latent_dim, 1, kernel_size=kernel_size,
                                   stride=1, padding=1)

    def forward(self, x):
        x = nn.functional.interpolate(x, size=self.output_dim)
        out = self.blocks(x)
        out = self.conv_last(out)
        out += x

        return out


class Residual_Block(nn.Module):
    def __init__(self, feature_dim, kernel_size, rescale=1):
        super(Residual_Block, self).__init__()

        self.block = nn.Sequential(
            nn.Conv2d(feature_dim, feature_dim, kernel_size, stride=1,
                      padding=1),
            nn.ReLU(),
            nn.Conv2d(feature_dim, feature_dim, kernel_size, stride=1,
                      padding=1)
        )

        self.rescale = rescale

    def forward(self, x):
        out = self.block(x)
        out *= self.rescale
        out += x
        return out


class EDSR(nn.Module):
    def __init__(self, latent_dim=256, n_resblocks=32, rescale=0.1,
                 output_dim=[251, 121]):
        super(EDSR, self).__init__()
        self.output_dim = output_dim
        kernel_size = 3
        # Input convolution, output of this will be added.
        self.conv_first = nn.Conv2d(1, latent_dim, kernel_size=kernel_size,
                                    stride=1, padding=1)

        # Resblocks block
        self.blocks = nn.Sequential()

        for res in range(n_resblocks):
            self.blocks.add_module(
                "Resblock {}".format(res),
                Residual_Block(latent_dim, kernel_size, rescale))

        # intermideate convolution
        self.conv_inter = nn.Conv2d(
            latent_dim, latent_dim, kernel_size=kernel_size, stride=1,
            padding=1)

        # upscaling , not used now
        """
        Input: (N,C∗upscale_factor2,H,W)
        Output: (N,C,H∗upscale_factor,W∗upscale_factor)

        upscale = 4
        self.upscale = nn.Sequential(
            nn.Conv2d(in_channels=latent_dim, out_channels=latent_dim*upscale,
                kernel_size=3, stride=1, padding=1, bias=False),
            nn.PixelShuffle(2),
            nn.Conv2d(in_channels=latent_dim, out_channels=latent_dim*upscale,
                kernel_size=3, stride=1, padding=1, bias=False),
            nn.PixelShuffle(2),
        )
        """
        # last convolution
        self.conv_last = nn.Conv2d(latent_dim, 1, kernel_size=kernel_size,
                                   stride=1, padding=1)

    def forward(self, x):
        x = nn.functional.interpolate(x, size=self.output_dim)
        image_processed = self.conv_first(x)
        out = self.blocks(image_processed)
        out += x
        # out = self.upscale(out)
        out = self.conv_last(out)

        return out


class Discriminator(nn.Module):
    def __init__(self, stride=2, input_dim=(251, 301)):
        """
        DCGAN discriminator modified to fit the data.
        """
        super(Discriminator, self).__init__()

        self.conv = nn.Sequential(
            nn.Conv2d(1, 32, 5, stride=stride),
            nn.LeakyReLU(0.2),
            nn.BatchNorm2d(32),

            nn.Conv2d(32, 64, 5, stride=stride),
            nn.LeakyReLU(0.2),
            nn.BatchNorm2d(64),

            nn.Conv2d(64, 128, 5, stride=2),
            nn.LeakyReLU(0.2),
            nn.BatchNorm2d(128),

            nn.Conv2d(128, 256, 5, stride=2),
            nn.LeakyReLU(0.2),
            nn.BatchNorm2d(256),

            nn.Conv2d(256, 512, 4, stride=2),
            nn.LeakyReLU(0.2),
            nn.BatchNorm2d(512),
        )

        # Determine dimensionality for fully connected layers.
        # Use batch size of two to deal with any BatchNorm layer.
        x = torch.zeros((2, 1, *input_dim))
        y = self.conv(x)
        num_hidden = y.numel() // 2
        print(f"Number of hidden elements: {num_hidden}")

        self.fc = nn.Sequential(
            nn.Linear(num_hidden, 2048),
            nn.LeakyReLU(0.2),
            nn.BatchNorm1d(2048),

            nn.Linear(2048, 1),
        )

    def forward(self, x):
        x = self.conv(x)
        x = x.view(len(x), -1)
        x = self.fc(x)

        return x


class PatchGAN(nn.Module):
    def __init__(self):
        """
        PatchGAN discriminator (https://arxiv.org/pdf/1611.07004.pdf).
        PatchGAN uses less parameters than a regular discriminator and
        can be applied to images of arbitrary size.
        """
        super(PatchGAN, self).__init__()

        self.conv = nn.Sequential(
            nn.Conv2d(1, 32, 4, stride=2),
            nn.LeakyReLU(0.2),
            nn.BatchNorm2d(32),

            nn.Conv2d(32, 64, 4, stride=2),
            nn.LeakyReLU(0.2),
            nn.BatchNorm2d(64),

            nn.Conv2d(64, 128, 4, stride=2),
            nn.LeakyReLU(0.2),
            nn.BatchNorm2d(128),

            nn.Conv2d(128, 256, 4),
            nn.LeakyReLU(0.2),
            nn.BatchNorm2d(256),

            nn.Conv2d(256, 1, 5),
        )

    def forward(self, x):
        x = self.conv(x)

        # Average over all patch predictions.
        return x.view(len(x), -1).mean(-1).unsqueeze(-1)


if __name__ == "__main__":
    data = torch.rand(10, 1, 251, 121)
    model = Discriminator()

    y = model(data)