Update _Dist/NeuralNetworks

carefree0910 · carefree0910 · commit a7b89de349bc · 2017-12-27T17:03:10.000+08:00
diff --git a/_Dist/NeuralNetworks/Base.py b/_Dist/NeuralNetworks/Base.py
@@ -571,7 +571,7 @@ def save_checkpoint(self, folder):
 
     def restore_checkpoint(self, folder):
         with self._graph.as_default():
-            tf.train.Saver().restore(self._sess, tf.train.latest_checkpoint(folder))
+            tf.train.Saver().restore(self._sess, os.path.join(folder, "Model"))
 
     # API
 
@@ -1007,7 +1007,7 @@ class AutoBase:
     def __init__(self, name=None, data_info=None, pre_process_settings=None, nan_handler_settings=None,
                  *args, **kwargs):
         if name is None:
-            raise ValueError("name should be provided when using AutoMixin")
+            raise ValueError("name should be provided when using AutoBase")
         self._name = name
 
         self._data_folder = None
@@ -1377,12 +1377,6 @@ def _load_data(self, data=None, numerical_idx=None, file_type="txt", names=("tra
 
         return x, y, x_test, y_test
 
-    def _define_py_collections(self):
-        self.py_collections += [
-            "pre_process_settings", "nan_handler_settings",
-            "_pre_processors", "_nan_handler", "transform_dicts"
-        ]
-
     def get_transformed_data_from_file(self, file, file_type="txt", include_label=False):
         x, _ = self._get_data_from_file(file_type, 0, file)
         return self._transform_data(x, "new", include_label=include_label)
@@ -1664,17 +1658,49 @@ def _get_score(mean, std, sign):
             return mean - std
         return mean + std
 
+    @staticmethod
+    def _extract_info(dtype, info):
+        if dtype == "choice":
+            return info[0][random.randint(0, len(info[0]) - 1)]
+        if len(info) == 2:
+            floor, ceiling = info
+            distribution = "linear"
+        else:
+            floor, ceiling, distribution = info
+        if ceiling <= floor:
+            raise ValueError("ceiling should be greater than floor")
+        if dtype == "int":
+            return random.randint(floor, ceiling)
+        if dtype == "float":
+            linear_target = floor + random.random() * (ceiling - floor)
+            distribution_error_msg = "distribution '{}' not supported in range_search".format(distribution)
+            if distribution == "linear":
+                return linear_target
+            if distribution[:3] == "log":
+                sign, log = int(linear_target > 0), math.log(math.fabs(linear_target))
+                if distribution == "log":
+                    return sign * math.exp(log)
+                if distribution == "log2":
+                    return sign * 2 ** log
+                if distribution == "log10":
+                    return sign * 10 ** log
+                raise NotImplementedError(distribution_error_msg)
+            raise NotImplementedError(distribution_error_msg)
+        raise NotImplementedError("dtype '{}' not supported in range_search".format(dtype))
+
     def _select_parameter(self, params):
         scores = []
         sign = Metrics.sign_dict[self._metric_name]
         for i, param in enumerate(params):
             mean, std = self.mean_record[i], self.std_record[i]
-            train_mean, cv_mean, test_mean = mean
-            train_std, cv_std, test_std = std
-            if test_mean is None or test_std is None:
+            if len(mean) == 2:
+                train_mean, cv_mean = mean
+                train_std, cv_std = std
                 weighted_mean = 0.2 * train_mean + 0.8 * cv_mean
                 weighted_std = 0.2 * train_std + 0.8 * cv_std
             else:
+                train_mean, cv_mean, test_mean = mean
+                train_std, cv_std, test_std = std
                 weighted_mean = 0.1 * train_mean + 0.2 * cv_mean + 0.7 * test_mean
                 weighted_std = 0.1 * train_std + 0.2 * cv_std + 0.7 * test_std
             scores.append(self._get_score(weighted_mean, weighted_std, sign))
@@ -1824,25 +1850,9 @@ def get_param_by_range(self, param):
         if not isinstance(dtype, str) and isinstance(dtype, collections.Iterable):
             local_param_list = []
             for local_dtype, local_info in zip(dtype, info):
-                if local_dtype == "choice":
-                    local_param_list.append(np.random.choice(local_info[0], 1)[0])
-                    continue
-                floor, ceiling = local_info
-                if local_dtype == "int":
-                    local_param_list.append(random.randint(floor, ceiling))
-                elif dtype == "float":
-                    local_param_list.append(floor + random.random() * (ceiling - floor))
-                else:
-                    raise NotImplementedError("dtype '{}' not supported in range_search".format(dtype))
+                local_param_list.append(self._extract_info(local_dtype, local_info))
             return local_param_list
-        if dtype == "choice":
-            return np.random.choice(info[0], 1)[0]
-        floor, ceiling = info
-        if dtype == "int":
-            return random.randint(floor, ceiling)
-        if dtype == "float":
-            return floor + random.random() * (ceiling - floor)
-        raise NotImplementedError("dtype '{}' not supported in range_search".format(dtype))
+        return self._extract_info(dtype, info)
 
     def range_search(self, n, grid_params, switch_to_best_params=True,
                      k=3, data=None, cv_rate=0.1, test_rate=0., sample_weights=None, **kwargs):
diff --git a/_Dist/NeuralNetworks/e_AdvancedNN/NN.py b/_Dist/NeuralNetworks/e_AdvancedNN/NN.py
@@ -97,7 +97,7 @@ def init_model_structure_settings(self):
     def _get_embedding(self, i, n):
         embedding_size = math.ceil(math.log2(n)) + 1 if self.embedding_size == "log" else self.embedding_size
         embedding = tf.Variable(tf.truncated_normal(
-            [n, embedding_size], mean=0, stddev=0.02
+            [1, embedding_size], mean=0, stddev=0.02
         ), name="Embedding{}".format(i))
         return tf.nn.embedding_lookup(embedding, self._categorical_xs[i], name="Embedded_X{}".format(i))
 
diff --git a/_Dist/NeuralNetworks/g_DistNN/NN.py b/_Dist/NeuralNetworks/g_DistNN/NN.py
@@ -5,7 +5,11 @@
     sys.path.append(root_path)
 
 from _Dist.NeuralNetworks.Base import DistMixin
-from _Dist.NeuralNetworks.f_AutoNN.NN import AutoAdvanced
+from _Dist.NeuralNetworks.f_AutoNN.NN import AutoBasic, AutoAdvanced
+
+
+class DistBasic(AutoBasic, DistMixin):
+    pass
 
 
 class DistAdvanced(AutoAdvanced, DistMixin):