Merge pull request rushter#56 from Antetokounpo/adamax

rushter · web-flow · commit a40c620bc8f5 · 2019-10-02T15:13:34.000+03:00
Add Adamax optimizer and unit test
diff --git a/mla/neuralnet/optimizers.py b/mla/neuralnet/optimizers.py
@@ -197,3 +197,31 @@ def setup(self, network):
             for n in layer.parameters.keys():
                 self.ms[i][n] = np.zeros_like(layer.parameters[n])
                 self.vs[i][n] = np.zeros_like(layer.parameters[n])
+
+class Adamax(Optimizer):
+    def __init__(self, learning_rate=0.002, beta_1=0.9, beta_2=0.999, epsilon=1e-8):
+
+        self.epsilon = epsilon
+        self.beta_2 = beta_2
+        self.beta_1 = beta_1
+        self.lr = learning_rate
+        self.t = 1
+
+    def update(self, network):
+        for i, layer in enumerate(network.parametric_layers):
+            for n in layer.parameters.keys():
+                grad = layer.parameters.grad[n]
+                self.ms[i][n] = self.beta_1 * self.ms[i][n] + (1.0 - self.beta_1) * grad
+                self.us[i][n] = np.maximum(self.beta_2 * self.us[i][n], np.abs(grad))
+
+                step = self.lr / (1 - self.beta_1 ** self.t) * self.ms[i][n]/(self.us[i][n] + self.epsilon)
+                layer.parameters.step(n, -step)
+        self.t += 1
+
+    def setup(self, network):
+        self.ms = defaultdict(dict)
+        self.us = defaultdict(dict)
+        for i, layer in enumerate(network.parametric_layers):
+            for n in layer.parameters.keys():
+                self.ms[i][n] = np.zeros_like(layer.parameters[n])
+                self.us[i][n] = np.zeros_like(layer.parameters[n])
diff --git a/mla/neuralnet/tests/test_optimizers.py b/mla/neuralnet/tests/test_optimizers.py
@@ -46,6 +46,8 @@ def test_adadelta():
 def test_adam():
     assert clasifier(Adam()) > 0.9
 
+def test_adamax():
+    assert clasifier(Adamax()) > 0.9
 
 def test_rmsprop():
     assert clasifier(RMSprop()) > 0.9