LINT.

ray-project · sven1977 · Jun 30, 2020 · Jun 24, 2020 · Jun 25, 2020 · Jun 25, 2020
commit 7c5b55bd1d2b1165eca2ff84d61094dc7d90fed6
@@ -98,7 +98,7 @@ def stats(policy, train_batch):
 
 def grad_stats(policy, train_batch, grads):
     return {
-        "grad_gnorm"      : tf.linalg.global_norm(grads),
+        "grad_gnorm": tf.linalg.global_norm(grads),
         "vf_explained_var": explained_variance(
             train_batch[Postprocessing.VALUE_TARGETS],
             policy.model.value_function()),

@@ -224,12 +224,12 @@ def stats(policy, train_batch):
         drop_last=policy.config["vtrace"])
 
     return {
-        "cur_lr"          : tf.cast(policy.cur_lr, tf.float64),
-        "policy_loss"     : policy.loss.pi_loss,
-        "entropy"         : policy.loss.entropy,
-        "entropy_coeff"   : tf.cast(policy.entropy_coeff, tf.float64),
-        "var_gnorm"       : tf.linalg.global_norm(policy.model.trainable_variables()),
-        "vf_loss"         : policy.loss.vf_loss,
+        "cur_lr": tf.cast(policy.cur_lr, tf.float64),
+        "policy_loss": policy.loss.pi_loss,
+        "entropy": policy.loss.entropy,
+        "entropy_coeff": tf.cast(policy.entropy_coeff, tf.float64),
+        "var_gnorm": tf.linalg.global_norm(policy.model.trainable_variables()),
+        "vf_loss": policy.loss.vf_loss,
         "vf_explained_var": explained_variance(
             tf.reshape(policy.loss.value_targets, [-1]),
             tf.reshape(values_batched, [-1])),

@@ -347,11 +347,11 @@ def stats(policy, train_batch):
         drop_last=policy.config["vtrace"])
 
     stats_dict = {
-        "cur_lr"          : tf.cast(policy.cur_lr, tf.float64),
-        "policy_loss"     : policy.loss.pi_loss,
-        "entropy"         : policy.loss.entropy,
-        "var_gnorm"       : tf.linalg.global_norm(policy.model.trainable_variables()),
-        "vf_loss"         : policy.loss.vf_loss,
+        "cur_lr": tf.cast(policy.cur_lr, tf.float64),
+        "policy_loss": policy.loss.pi_loss,
+        "entropy": policy.loss.entropy,
+        "var_gnorm": tf.linalg.global_norm(policy.model.trainable_variables()),
+        "vf_loss": policy.loss.vf_loss,
         "vf_explained_var": explained_variance(
             tf.reshape(policy.loss.value_targets, [-1]),
             tf.reshape(values_batched, [-1])),