具体可以参考deepmind团队的论文
mnist(60x60x1)和SVHN
SVHN下载format1格式,如图
在训练过程中意外发现,如果对数据集SVHN 进行训练,不加STN模块的网络训练结果会比加STN模块的网络的训练结果要好。
- 不带STN的CNN关于数据集svhn的训练结果
- 带STN的CNN关于数据集svhn的训练结果
- 原因
在SVHN数据集中有每张图片上每个数字的定位点,由于每张图片的尺寸不同,原始图片输入到神经网络时会自动根据每个数字的定位点提取出数字的图片,不需要STN
数据集原图 输入到神经网络中
STN.py定义了4个网络
train_mnist.py,train_mnist_without_stn训练mnist
train_SVHN.py,train_SVHN_without_stn训练SVHN