wuziheng / CNN-Numpy Public

Notifications You must be signed in to change notification settings
Fork 65
Star 302

Inplement an CNN frame with Numpy, easy to learn, hard to use hhhh

302 stars 65 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.idea		.idea
data/mnist		data/mnist
fig		fig
layers		layers
logs		logs
tensor		tensor
README.md		README.md
lenet_layers.py		lenet_layers.py
lenet_tensor.py		lenet_tensor.py
plot.py		plot.py
plot.pyc		plot.pyc
test_conv.py		test_conv.py

Repository files navigation

CNN Inplementation With Numpy

复习深度学习相关知识。打算用numpy实现一个简单的可以训练，测试的cnn框架（model-free，model-based），包含一些主流的层和设计，以便复习与巩固基础。

2018.01.22

Target1: （model-free）实现mnist的训练与测试：

layer: Conv2D, FullyConnect, MaxPooling, Softmax
activation: Relu
method: Mini-batch Gradient Descent(SGD)，learning_rate = 1e-5

version	validation_acc	train_acc	inferencetime(ms/pf)
baseline	96.75%	97.15%	2(ms/pf)

2018.01.24

Target2: 　(model-based)实现Variable与Operator分离设计：

完成Variable与Operator 类的设计与graph的注册功能，GLOBAL_VARIABLE_SCOPE作为全局所有Variable,Operator的索引(graph)，Operator,Variable类自己维护自己的child,parent列表。（感觉有点像tf）
完成Conv2D类的设计，对比上一版本进行测试通过。

2018.01.25

完成其他基本组件的Operator改写。新版本支持隐式构建graph，调用converge（汇） Variable.eval()自动完成前向传播计算；调用对应的source(源)Variable.diff_eval()自动完成反向传播与导数计算；对于learnable的Variable，手动调用Variable.apply_gradient()完成梯度下降。（未来目标把上述操作封转到显示的graph 或者session类中）

2018.01.26

给train_epoch读入图片添加了shuffle
完成了不同的激活函数relu,leaky-relu,sigmoid,tanh,elu, prelu
完成了对激活函数的grad_check,实际上sigmoid确实容易出现gradient-vanish,所以一开始用1e-5学习率基本收敛的特别慢，所以实际测试里面调整到了1e-3
初始化默认为init='MSRA', 实际上没有做仔细的调整，最终的结果上比较性并不是特别强，但是我们可以明显发现sigmoid和tanh的计算速度要慢一些，同时我们将给出前100个iteration的loss曲线，我们可以发现，收敛速度上的差别。即使sigmoid,tanh使用了较大的learning_rate,依然收敛的慢一些。

version	validation_acc	train_acc	learning_rate	epoch（max=20）
SGD_RELU (alpha=0)	96.42%	96.85%	1e-5	11
SGD_LRELU(alpha=0.01)	97.78%	97.22%	1e-5	17
SGD_LRELU(alpha=0.001)	97.98%	97.27%	1e-5	16
SGD_SIGMOID	96.65%	95.61%	1e-3	16
SGD_TANH	96.41%	91.12%	1e-3~1e-4	2
SGD_ELU	97.74%	97.26%	1e-5	13

About

Inplement an CNN frame with Numpy, easy to learn, hard to use hhhh

Report repository

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%