fix the ci problem

zkh2016 · zkh2016 · commit 1cc8aad1545c · 2021-08-30T06:29:50.000Z
diff --git a/paddle/fluid/operators/multi_dot_op.cc b/paddle/fluid/operators/multi_dot_op.cc
@@ -63,17 +63,11 @@ inline framework::DDim ComputeAndCheckShape(
   // If the last tensor is 1D of size n view it as a column vector (n, 1)
   if (last_dim.size() == 1) {
     last_dim = framework::make_ddim({static_cast<int>(last_dim[0]), 1});
-    if (is_vector) {
-      out_dim = framework::make_ddim({1});
-    } else {
-      out_dim = framework::make_ddim({first_dim[0]});
-    }
+    out_dim = is_vector ? framework::make_ddim({1})
+                        : framework::make_ddim({first_dim[0]});
   } else {
-    if (is_vector) {
-      out_dim = framework::make_ddim({last_dim[1]});
-    } else {
-      out_dim = framework::make_ddim({first_dim[0], last_dim[1]});
-    }
+    out_dim = is_vector ? framework::make_ddim({last_dim[1]})
+                        : framework::make_ddim({first_dim[0], last_dim[1]});
   }
 
   auto width = first_dim[1];
@@ -83,21 +77,21 @@ inline framework::DDim ComputeAndCheckShape(
                           "the input tensor of multi_dot op must be 2D."));
 
     const auto& tmp_dim = inputs_dims[i];
-    PADDLE_ENFORCE_EQ(tmp_dim[0], width,
-                      platform::errors::InvalidArgument(
-                          "the input tensor of multi_dot op must be 2D."));
+    PADDLE_ENFORCE_EQ(
+        tmp_dim[0], width,
+        platform::errors::InvalidArgument(
+            "the input matrix does not meet the multiplication requirements."));
     width = tmp_dim[1];
   }
-  PADDLE_ENFORCE_EQ(last_dim[0], width,
-                    platform::errors::InvalidArgument(
-                        "the input tensor of multi_dot op must be 2D."));
+
+  PADDLE_ENFORCE_EQ(
+      last_dim[0], width,
+      platform::errors::InvalidArgument(
+          "the input matrix does not meet the multiplication requirements."));
 
   return out_dim;
 }
 
-/**
- * @brief the matrix multiplication
- */
 template <typename DeviceContext, typename T>
 inline framework::Tensor MatMul(const framework::ExecutionContext& ctx,
                                 const framework::Tensor& matrix_a,
@@ -109,8 +103,8 @@ inline framework::Tensor MatMul(const framework::ExecutionContext& ctx,
 
   framework::Tensor matrix_c;
   framework::DDim c_dim = framework::make_ddim({a_dim[0], b_dim[1]});
-  matrix_c.mutable_data<T>(place, c_dim[0] * c_dim[1] * sizeof(T));
   matrix_c.Resize(c_dim);
+  matrix_c.mutable_data<T>(place);
 
   auto mat_dim_a = math::CreateMatrixDescriptor(a_dim, 0, false);
   auto mat_dim_b = math::CreateMatrixDescriptor(b_dim, 0, false);
@@ -330,27 +324,23 @@ class MultiDotKernel : public framework::OpKernel<T> {
       const auto Ka = ins_dims[0][1];
       const auto Nb = ins_dims[1][1];
       const auto Nc = ins_dims[2][1];
-      const uint64_t cost1 =
-          Ma * Nb * (Ka + Nc);  // Ma * Ka * Nb + Ma * Nb * Nc;
-      const uint64_t cost2 =
-          Ka * Nc * (Nb + Ma);  // Ka * Nb * Nc + Ma * Ka * Nc;
+      const uint64_t cost1 = Ma * Nb * (Ka + Nc);
+      const uint64_t cost2 = Ka * Nc * (Nb + Ma);
       auto mat_dim_a = math::CreateMatrixDescriptor(ins_dims[0], 0, false);
       auto mat_dim_b = math::CreateMatrixDescriptor(ins_dims[1], 0, false);
       auto mat_dim_c = math::CreateMatrixDescriptor(ins_dims[2], 0, false);
       if (cost1 < cost2) {
         framework::Tensor tmp_out;
         tmp_out.mutable_data<T>(place, Ma * Nb * sizeof(T));
-        framework::DDim tmp_dim = ins_dims[0];
-        tmp_dim[1] = Nb;
+        framework::DDim tmp_dim = framework::make_ddim({Ma, Nb});
         blas.MatMul(*ins[0], mat_dim_a, *ins[1], mat_dim_b, scale, &tmp_out,
                     T(0));
         auto mat_dim_tmp = math::CreateMatrixDescriptor(tmp_dim, 0, false);
         blas.MatMul(tmp_out, mat_dim_tmp, *ins[2], mat_dim_c, scale, out, T(0));
       } else {
         framework::Tensor tmp_out;
         tmp_out.mutable_data<T>(place, Ka * Nc * sizeof(T));
-        framework::DDim tmp_dim = ins_dims[1];
-        tmp_dim[1] = Nc;
+        framework::DDim tmp_dim = framework::make_ddim({Ka, Nc});
         blas.MatMul(*ins[1], mat_dim_b, *ins[2], mat_dim_c, scale, &tmp_out,
                     T(0));
         auto mat_dim_tmp = math::CreateMatrixDescriptor(tmp_dim, 0, false);
@@ -361,7 +351,6 @@ class MultiDotKernel : public framework::OpKernel<T> {
       const auto tmp = MultiDotMatChainOrder<DeviceContext, T>(
           ctx, ins, ins_dims, false, &results);
       auto out_dim = out->dims();
-      // TensorCopy(tmp, place, ctx.device_context(), out);
       *out = tmp;
       out->Resize(out_dim);
     }
@@ -473,7 +462,6 @@ class MultiDotGradKernel : public framework::OpKernel<T> {
     dB.mutable_data<T>(ctx.GetPlace());
 
     CalcGrad(ctx, dout, *A, *B, dout_dim, a_dim, b_dim, &dA, &dB);
-
     MatChainMulGrad(ctx, dA, dx, ins, dA.dims(), ins_dims, order, i, right,
                     results);
     MatChainMulGrad(ctx, dB, dx, ins, dB.dims(), ins_dims, order, left, j,
@@ -489,7 +477,6 @@ class MultiDotGradKernel : public framework::OpKernel<T> {
     auto order = GetOrder(ins, ins_dims);
     auto n = ins.size();
     std::vector<framework::Tensor> results(n * n);
-    // call the forward, get the itermediate result
     MatChainMul<DeviceContext, T>(ctx, ins, ins_dims, order, 0, n - 1, true,
                                   &results);
     MatChainMulGrad(ctx, dout, dx, ins, dout_dim, ins_dims, order, 0, n - 1,
@@ -548,21 +535,10 @@ class MultiDotGradKernel : public framework::OpKernel<T> {
         tmp_out.mutable_data<T>(place);
         tmp_dout.Resize({mat_dim_dout.height_, Nb});
         tmp_dout.mutable_data<T>(place);
-        // tmp_out = A * B
         blas.MatMul(*ins[0], mat_dim_a, *ins[1], mat_dim_b, alpha, &tmp_out,
                     T(0));
-
-        /*
-         * dC = dout * transpose(tmp_out)
-         * tmp_dout = dout * transpose(C)
-         */
         CalcGrad(ctx, dout, tmp_out, *ins[2], dout_dim, tmp_out.dims(),
                  ins_dims[2], &tmp_dout, dx[2]);
-
-        /*
-         * dA = tmp_dout * transpose(B)
-         * dB = tmp_dout * transpose(A)
-         */
         CalcGrad(ctx, tmp_dout, *ins[0], *ins[1], tmp_dout.dims(), ins_dims[0],
                  ins_dims[1], dx[0], dx[1]);
       } else {
@@ -573,18 +549,8 @@ class MultiDotGradKernel : public framework::OpKernel<T> {
         tmp_dout.mutable_data<T>(place);
         blas.MatMul(*ins[1], mat_dim_b, *ins[2], mat_dim_c, alpha, &tmp_out,
                     T(0));
-
-        /*
-         * dA = dout * transpose(tmp_out)
-         * tmp_out = dout * transpose(A)
-         */
         CalcGrad(ctx, dout, *ins[0], tmp_out, dout_dim, ins_dims[0],
                  tmp_dout.dims(), dx[0], &tmp_dout);
-
-        /*
-         * dB = tmp_dout * transpose(C)
-         * dC = tmp_dout * transpose(B)
-         */
         CalcGrad(ctx, tmp_dout, *ins[1], *ins[2], tmp_dout.dims(), ins_dims[1],
                  ins_dims[2], dx[1], dx[2]);
       }
diff --git a/python/paddle/fluid/tests/unittests/test_multi_dot_op.py b/python/paddle/fluid/tests/unittests/test_multi_dot_op.py
@@ -31,7 +31,7 @@ def setUp(self):
         self.get_inputs_and_outputs()
 
     def get_dtype(self):
-        return "float32"
+        return "float64"
 
     def get_inputs_and_outputs(self):
         self.A = np.random.random((2, 8)).astype(self.dtype)
@@ -43,8 +43,8 @@ def test_check_output(self):
         self.check_output()
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
 
 
 class TestMultiDotOpDouble(TestMultiDotOp):
@@ -62,9 +62,9 @@ def get_inputs_and_outputs(self):
         self.outputs = {'Out': multi_dot([self.A, self.B, self.C])}
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x2'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
+        self.check_grad(['x2'], 'Out')
 
 
 #A*(B*C)
@@ -77,9 +77,9 @@ def get_inputs_and_outputs(self):
         self.outputs = {'Out': multi_dot([self.A, self.B, self.C])}
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x2'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
+        self.check_grad(['x2'], 'Out')
 
 
 class TestMultiDotOp4Mat(TestMultiDotOp):
@@ -95,10 +95,10 @@ def get_inputs_and_outputs(self):
         self.outputs = {'Out': multi_dot([self.A, self.B, self.C, self.D])}
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x2'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x3'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
+        self.check_grad(['x2'], 'Out')
+        self.check_grad(['x3'], 'Out')
 
 
 class TestMultiDotOpFirst1D(TestMultiDotOp):
@@ -118,9 +118,9 @@ def get_inputs_and_outputs(self):
         self.outputs = {'Out': multi_dot([self.A, self.B, self.C])}
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x2'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
+        self.check_grad(['x2'], 'Out')
 
 
 class TestMultiDotOp4MatFirst1D(TestMultiDotOp):
@@ -136,10 +136,10 @@ def get_inputs_and_outputs(self):
         self.outputs = {'Out': multi_dot([self.A, self.B, self.C, self.D])}
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x2'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x3'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
+        self.check_grad(['x2'], 'Out')
+        self.check_grad(['x3'], 'Out')
 
 
 class TestMultiDotOpLast1D(TestMultiDotOp):
@@ -159,9 +159,9 @@ def get_inputs_and_outputs(self):
         self.outputs = {'Out': multi_dot([self.A, self.B, self.C])}
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x2'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
+        self.check_grad(['x2'], 'Out')
 
 
 class TestMultiDotOp4MatLast1D(TestMultiDotOp):
@@ -177,10 +177,10 @@ def get_inputs_and_outputs(self):
         self.outputs = {'Out': multi_dot([self.A, self.B, self.C, self.D])}
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x2'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x3'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
+        self.check_grad(['x2'], 'Out')
+        self.check_grad(['x3'], 'Out')
 
 
 class TestMultiDotOpFirstAndLast1D(TestMultiDotOp):
@@ -191,8 +191,8 @@ def get_inputs_and_outputs(self):
         self.outputs = {'Out': multi_dot([self.A, self.B])}
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
 
 
 class TestMultiDotOp3MatFirstAndLast1D(TestMultiDotOp):
@@ -204,9 +204,9 @@ def get_inputs_and_outputs(self):
         self.outputs = {'Out': multi_dot([self.A, self.B, self.C])}
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x2'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
+        self.check_grad(['x2'], 'Out')
 
 
 class TestMultiDotOp4MatFirstAndLast1D(TestMultiDotOp):
@@ -222,10 +222,10 @@ def get_inputs_and_outputs(self):
         self.outputs = {'Out': multi_dot([self.A, self.B, self.C, self.D])}
 
     def test_check_grad(self):
-        self.check_grad(['x0'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x1'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x2'], 'Out', max_relative_error=1e-3)
-        self.check_grad(['x3'], 'Out', max_relative_error=1e-3)
+        self.check_grad(['x0'], 'Out')
+        self.check_grad(['x1'], 'Out')
+        self.check_grad(['x2'], 'Out')
+        self.check_grad(['x3'], 'Out')
 
 
 #####python API test#######
@@ -236,41 +236,41 @@ def test_errors(self):
             input1 = 12
             self.assertRaises(TypeError, paddle.multi_dot, [input1, input1])
 
-            # The inputs dtype of multi_dot must be float32, float64 or float16.
+            # The inputs dtype of multi_dot must be float64, float64 or float16.
             input2 = fluid.layers.data(
                 name='input2', shape=[10, 10], dtype="int32")
             self.assertRaises(TypeError, paddle.multi_dot, [input2, input2])
 
             # the number of tensor must be larger than 1
-            x0 = fluid.data(name='x0', shape=[3, 2], dtype="float32")
+            x0 = fluid.data(name='x0', shape=[3, 2], dtype="float64")
             self.assertRaises(ValueError, paddle.multi_dot, [x0])
 
             #the first tensor must be 1D or 2D
-            x1 = fluid.data(name='x1', shape=[3, 2, 3], dtype="float32")
-            x2 = fluid.data(name='x2', shape=[3, 2], dtype="float32")
+            x1 = fluid.data(name='x1', shape=[3, 2, 3], dtype="float64")
+            x2 = fluid.data(name='x2', shape=[3, 2], dtype="float64")
             self.assertRaises(ValueError, paddle.multi_dot, [x1, x2])
 
             #the last tensor must be 1D or 2D
-            x3 = fluid.data(name='x3', shape=[3, 2], dtype="float32")
-            x4 = fluid.data(name='x4', shape=[3, 2, 2], dtype="float32")
+            x3 = fluid.data(name='x3', shape=[3, 2], dtype="float64")
+            x4 = fluid.data(name='x4', shape=[3, 2, 2], dtype="float64")
             self.assertRaises(ValueError, paddle.multi_dot, [x3, x4])
 
             #the tensor must be 2D, except first and last tensor
-            x5 = fluid.data(name='x5', shape=[3, 2], dtype="float32")
-            x6 = fluid.data(name='x6', shape=[2], dtype="float32")
-            x7 = fluid.data(name='x7', shape=[2, 2], dtype="float32")
+            x5 = fluid.data(name='x5', shape=[3, 2], dtype="float64")
+            x6 = fluid.data(name='x6', shape=[2], dtype="float64")
+            x7 = fluid.data(name='x7', shape=[2, 2], dtype="float64")
             self.assertRaises(ValueError, paddle.multi_dot, [x5, x6, x7])
 
 
 class API_TestMultiDot(unittest.TestCase):
     def test_out(self):
         with fluid.program_guard(fluid.Program()):
-            x0 = fluid.data(name='x0', shape=[3, 2], dtype="float32")
-            x1 = fluid.data(name='x1', shape=[2, 3], dtype='float32')
+            x0 = fluid.data(name='x0', shape=[3, 2], dtype="float64")
+            x1 = fluid.data(name='x1', shape=[2, 3], dtype='float64')
             result = paddle.multi_dot([x0, x1])
             exe = fluid.Executor(fluid.CPUPlace())
-            data1 = np.random.rand(3, 2).astype("float32")
-            data2 = np.random.rand(2, 3).astype("float32")
+            data1 = np.random.rand(3, 2).astype("float64")
+            data2 = np.random.rand(2, 3).astype("float64")
             np_res = exe.run(feed={'x0': data1,
                                    'x1': data2},
                              fetch_list=[result])
diff --git a/python/paddle/fluid/tests/unittests/white_list/no_grad_set_white_list.py b/python/paddle/fluid/tests/unittests/white_list/no_grad_set_white_list.py
@@ -65,7 +65,6 @@
     'rank_loss',
     'sequence_conv',
     'smooth_l1_loss',
-    'spectral_norm',
-    'multi_dot',
+    'spectral_norm'
 ]
 # yapf: enable
diff --git a/python/paddle/fluid/tests/unittests/white_list/op_accuracy_white_list.py b/python/paddle/fluid/tests/unittests/white_list/op_accuracy_white_list.py
@@ -76,8 +76,7 @@
     'trilinear_interp_v2', \
     'var_conv_2d', \
     'warpctc', \
-    'bilateral_slice',
-    'multi_dot'
+    'bilateral_slice'
 ]
 
 NO_FP16_CHECK_GRAD_OP_LIST = [
diff --git a/python/paddle/linalg.py b/python/paddle/linalg.py
@@ -22,6 +22,6 @@
     'cholesky',  #noqa
     'norm',
     'inv',
+    'matrix_power',
     'multi_dot'
-    'matrix_power'
 ]
diff --git a/python/paddle/tensor/__init__.py b/python/paddle/tensor/__init__.py
diff --git a/python/paddle/tensor/linalg.py b/python/paddle/tensor/linalg.py

Original file line number	Diff line number	Diff line change
`@@ -65,7 +65,6 @@`
`65`	`65`	`'rank_loss',`
`66`	`66`	`'sequence_conv',`
`67`	`67`	`'smooth_l1_loss',`
`68`		`- 'spectral_norm',`
`69`		`- 'multi_dot',`
	`68`	`+ 'spectral_norm'`
`70`	`69`	`]`
`71`	`70`	`# yapf: enable`
Original file line number	Diff line number	Diff line change
`@@ -76,8 +76,7 @@`
`76`	`76`	`'trilinear_interp_v2', \`
`77`	`77`	`'var_conv_2d', \`
`78`	`78`	`'warpctc', \`
`79`		`- 'bilateral_slice',`
`80`		`- 'multi_dot'`
	`79`	`+ 'bilateral_slice'`
`81`	`80`	`]`
`82`	`81`
`83`	`82`	`NO_FP16_CHECK_GRAD_OP_LIST = [`
Original file line number	Diff line number	Diff line change
`@@ -22,6 +22,6 @@`
`22`	`22`	`'cholesky', #noqa`
`23`	`23`	`'norm',`
`24`	`24`	`'inv',`
	`25`	`+ 'matrix_power',`
`25`	`26`	`'multi_dot'`
`26`		`- 'matrix_power'`
`27`	`27`	`]`