microsoft
diff --git a/‎examples/rl/cim/algorithms/ac.py‎
Lines changed: 4 additions & 4 deletions b/‎examples/rl/cim/algorithms/ac.py‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎examples/rl/cim/algorithms/dqn.py‎
Lines changed: 2 additions & 2 deletions b/‎examples/rl/cim/algorithms/dqn.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎examples/rl/cim/algorithms/maddpg.py‎
Lines changed: 4 additions & 4 deletions b/‎examples/rl/cim/algorithms/maddpg.py‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎examples/rl/vm_scheduling/algorithms/ac.py‎
Lines changed: 4 additions & 4 deletions b/‎examples/rl/vm_scheduling/algorithms/ac.py‎
Lines changed: 4 additions & 4 deletions
diff --git a/‎examples/rl/vm_scheduling/algorithms/dqn.py‎
Lines changed: 2 additions & 2 deletions b/‎examples/rl/vm_scheduling/algorithms/dqn.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎examples/rl/vm_scheduling/config.py‎
Lines changed: 1 addition & 1 deletion b/‎examples/rl/vm_scheduling/config.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎maro/cli/local/utils.py‎
Lines changed: 0 additions & 2 deletions b/‎maro/cli/local/utils.py‎
Lines changed: 0 additions & 2 deletions
diff --git a/‎maro/rl/distributed/abs_worker.py‎
Lines changed: 4 additions & 3 deletions b/‎maro/rl/distributed/abs_worker.py‎
Lines changed: 4 additions & 3 deletions
diff --git a/‎maro/rl/model/abs_net.py‎
Lines changed: 2 additions & 2 deletions b/‎maro/rl/model/abs_net.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎maro/rl/policy/continuous_rl_policy.py‎
Lines changed: 2 additions & 2 deletions b/‎maro/rl/policy/continuous_rl_policy.py‎
Lines changed: 2 additions & 2 deletions
@@ -60,13 +60,13 @@ def apply_gradients(self, grad: dict) -> None:
             param.grad = grad[name]
         self._optim.step()
 
-    def get_net_state(self) -> dict:
+    def get_state(self) -> dict:
         return {
             "network": self.state_dict(),
             "optim": self._optim.state_dict()
         }
 
-    def set_net_state(self, net_state: dict) -> None:
+    def set_state(self, net_state: dict) -> None:
         self.load_state_dict(net_state["network"])
         self._optim.load_state_dict(net_state["optim"])
 
@@ -95,13 +95,13 @@ def apply_gradients(self, grad: dict) -> None:
             param.grad = grad[name]
         self._optim.step()
 
-    def get_net_state(self) -> dict:
+    def get_state(self) -> dict:
         return {
             "network": self.state_dict(),
             "optim": self._optim.state_dict()
         }
 
-    def set_net_state(self, net_state: dict) -> None:
+    def set_state(self, net_state: dict) -> None:
         self.load_state_dict(net_state["network"])
         self._optim.load_state_dict(net_state["optim"])
 
 
@@ -47,10 +47,10 @@ def apply_gradients(self, grad: dict) -> None:
             param.grad = grad[name]
         self._optim.step()
 
-    def get_net_state(self) -> object:
+    def get_state(self) -> object:
         return {"network": self.state_dict(), "optim": self._optim.state_dict()}
 
-    def set_net_state(self, net_state: object) -> None:
+    def set_state(self, net_state: object) -> None:
         assert isinstance(net_state, dict)
         self.load_state_dict(net_state["network"])
         self._optim.load_state_dict(net_state["optim"])
 
@@ -62,13 +62,13 @@ def apply_gradients(self, grad: dict) -> None:
             param.grad = grad[name]
         self._optim.step()
 
-    def get_net_state(self) -> dict:
+    def get_state(self) -> dict:
         return {
             "network": self.state_dict(),
             "optim": self._optim.state_dict()
         }
 
-    def set_net_state(self, net_state: dict) -> None:
+    def set_state(self, net_state: dict) -> None:
         self.load_state_dict(net_state["network"])
         self._optim.load_state_dict(net_state["optim"])
 
@@ -97,13 +97,13 @@ def apply_gradients(self, grad: dict) -> None:
             param.grad = grad[name]
         self._optim.step()
 
-    def get_net_state(self) -> dict:
+    def get_state(self) -> dict:
         return {
             "network": self.state_dict(),
             "optim": self._optim.state_dict()
         }
 
-    def set_net_state(self, net_state: dict) -> None:
+    def set_state(self, net_state: dict) -> None:
         self.load_state_dict(net_state["network"])
         self._optim.load_state_dict(net_state["optim"])
 
 
@@ -64,13 +64,13 @@ def apply_gradients(self, grad: dict) -> None:
             param.grad = grad[name]
         self._optim.step()
 
-    def get_net_state(self) -> dict:
+    def get_state(self) -> dict:
         return {
             "network": self.state_dict(),
             "optim": self._optim.state_dict()
         }
 
-    def set_net_state(self, net_state: dict) -> None:
+    def set_state(self, net_state: dict) -> None:
         self.load_state_dict(net_state["network"])
         self._optim.load_state_dict(net_state["optim"])
 
@@ -102,13 +102,13 @@ def apply_gradients(self, grad: dict) -> None:
             param.grad = grad[name]
         self._optim.step()
 
-    def get_net_state(self) -> dict:
+    def get_state(self) -> dict:
         return {
             "network": self.state_dict(),
             "optim": self._optim.state_dict()
         }
 
-    def set_net_state(self, net_state: dict) -> None:
+    def set_state(self, net_state: dict) -> None:
         self.load_state_dict(net_state["network"])
         self._optim.load_state_dict(net_state["optim"])
 
 
@@ -55,10 +55,10 @@ def apply_gradients(self, grad: dict) -> None:
             param.grad = grad[name]
         self._optim.step()
 
-    def get_net_state(self) -> object:
+    def get_state(self) -> object:
         return {"network": self.state_dict(), "optim": self._optim.state_dict()}
 
-    def set_net_state(self, net_state: object) -> None:
+    def set_state(self, net_state: object) -> None:
         assert isinstance(net_state, dict)
         self.load_state_dict(net_state["network"])
         self._optim.load_state_dict(net_state["optim"])
 
@@ -41,4 +41,4 @@
 
 test_seed = 1024
 
-algorithm = "dqn"  # "dqn" or "ac"
+algorithm = "ac"  # "dqn" or "ac"
@@ -158,8 +158,6 @@ def get_docker_compose_yml(config: dict, context: str, dockerfile_path: str, ima
         }
         for component, env in config_parser.get_rl_component_env_vars(config, containerized=True).items()
     }
-    # if config["mode"] != "single":
-    #     manifest["services"]["redis"] = {"image": "redis", "container_name": redis_host}
 
     return manifest
 
 
@@ -10,20 +10,21 @@
 from zmq.eventloop.zmqstream import ZMQStream
 
 from maro.rl.utils.common import string_to_bytes
-from maro.utils import Logger
+from maro.utils import DummyLogger, Logger
 
 
 class AbsWorker(object):
     def __init__(
         self,
         idx: int,
         router_host: str,
-        router_port: int = 10001
+        router_port: int = 10001,
+        logger: Logger = None
     ) -> None:
         super(AbsWorker, self).__init__()
 
         self._id = f"worker.{idx}"
-        self._logger = Logger(self._id)
+        self._logger = DummyLogger() if logger is None else logger
 
         # ZMQ sockets and streams
         self._context = Context.instance()
 
@@ -48,14 +48,14 @@ def _forward_unimplemented(self, *input: Any) -> None:  # TODO
         pass
 
     @abstractmethod
-    def get_net_state(self) -> object:
+    def get_state(self) -> object:
         """
         Get the net's state.
         """
         raise NotImplementedError
 
     @abstractmethod
-    def set_net_state(self, net_state: object) -> None:
+    def set_state(self, net_state: object) -> None:
         """
         Set the net's state.
         """
 
@@ -100,10 +100,10 @@ def train(self) -> None:
         self._policy_net.train()
 
     def get_state(self) -> object:
-        return self._policy_net.get_net_state()
+        return self._policy_net.get_state()
 
     def set_state(self, policy_state: object) -> None:
-        self._policy_net.set_net_state(policy_state)
+        self._policy_net.set_state(policy_state)
 
     def soft_update(self, other_policy: RLPolicy, tau: float) -> None:
         assert isinstance(other_policy, ContinuousRLPolicy)
Original file line number	Diff line number	Diff line change
`@@ -41,4 +41,4 @@`
`41`	`41`
`42`	`42`	`test_seed = 1024`
`43`	`43`
`44`		`-algorithm = "dqn" # "dqn" or "ac"`
	`44`	`+algorithm = "ac" # "dqn" or "ac"`
Original file line number	Diff line number	Diff line change
`@@ -158,8 +158,6 @@ def get_docker_compose_yml(config: dict, context: str, dockerfile_path: str, ima`
`158`	`158`	`}`
`159`	`159`	`for component, env in config_parser.get_rl_component_env_vars(config, containerized=True).items()`
`160`	`160`	`}`
`161`		`- # if config["mode"] != "single":`
`162`		`- # manifest["services"]["redis"] = {"image": "redis", "container_name": redis_host}`
`163`	`161`
`164`	`162`	`return manifest`
`165`	`163`