Be consistent with RNG and FPType in native random forests

IntelPython · bibikar · Jun 27, 2019 · Jun 6, 2019 · Jun 6, 2019 · Jun 6, 2019
commit 54d1b4d859fceeaa1d4c00803e8ef4c8efe9ef58
diff --git a/Makefile b/Makefile
@@ -135,6 +135,14 @@ daal4py: data
 		--fileX data/multi/X-$(SVM_SAMPLES)x$(SVM_FEATURES).npy \
 		--fileY data/multi/y-$(SVM_SAMPLES)x$(SVM_FEATURES).npy \
 		--header
+	python daal4py/df_clsf.py --num-threads $(NUM_THREADS) \
+		--fileX data/two/X-$(SVM_SAMPLES)x$(SVM_FEATURES).npy \
+		--fileY data/two/y-$(SVM_SAMPLES)x$(SVM_FEATURES).npy \
+		--header
+	python daal4py/df_clsf.py --num-threads $(NUM_THREADS) \
+		--fileX data/multi/X-$(SVM_SAMPLES)x$(SVM_FEATURES).npy \
+		--fileY data/multi/y-$(SVM_SAMPLES)x$(SVM_FEATURES).npy \
+		--header
 
 data: $(KMEANS_DATA) svm_data
 

diff --git a/native/decision_forest_clsf_bench.cpp b/native/decision_forest_clsf_bench.cpp
@@ -57,7 +57,7 @@ df_classification_fit(
     df_clsf_alg.parameter.minObservationsInLeafNode = 1;
     df_clsf_alg.parameter.impurityThreshold = min_impurity;
     df_clsf_alg.parameter.bootstrap = bootsrap;
-    df_clsf_alg.parameter.engine = da::engines::mt19937::Batch<double>::create(seed);
+    df_clsf_alg.parameter.engine = da::engines::mt2203::Batch<double>::create(seed);
 
     if (verbose) {
 	std::cout << "@ {'nTrees': " << nTrees <<
@@ -88,7 +88,8 @@ df_classification_predict(
     bool verbose
     )
 {
-    dfc::prediction::Batch<double> pred_alg(nClasses);
+    // We explicitly specify float here to match sklearn.
+    dfc::prediction::Batch<float> pred_alg(nClasses);
     pred_alg.input.set(da::classifier::prediction::data, Xt);
     pred_alg.input.set(da::classifier::prediction::model,
 		       training_result_ptr->get(da::classifier::training::model));

diff --git a/native/decision_forest_regr_bench.cpp b/native/decision_forest_regr_bench.cpp
@@ -55,7 +55,7 @@ df_regression_fit(
     df_reg_alg.parameter.minObservationsInLeafNode = 1;
     df_reg_alg.parameter.impurityThreshold = min_impurity;
     df_reg_alg.parameter.bootstrap = bootsrap;
-    df_reg_alg.parameter.engine = da::engines::mt19937::Batch<double>::create(seed);
+    df_reg_alg.parameter.engine = da::engines::mt2203::Batch<double>::create(seed);
 
     if (verbose) {
 	std::cout << "@ {'nTrees': " << nTrees <<
@@ -85,7 +85,8 @@ df_regression_predict(
     bool verbose
     )
 {
-    dfr::prediction::Batch<double> pred_alg;
+    // We explicitly specify float here to match sklearn.
+    dfr::prediction::Batch<float> pred_alg;
     pred_alg.input.set(dfr::prediction::data, Xt);
     pred_alg.input.set(dfr::prediction::model,
 		       training_result_ptr->get(dfr::training::model));