修改enqueueV3

PaddlePaddle · yuanlehome · Jan 12, 2024 · Dec 12, 2023 · Dec 14, 2023 · Dec 25, 2023
commit 4a5b62d7d5e6f9756cad5d5ff8cf1458fa9de879
diff --git a/paddle/fluid/inference/tensorrt/engine.cc b/paddle/fluid/inference/tensorrt/engine.cc
@@ -173,13 +173,6 @@ bool TensorRTEngine::Enqueue(nvinfer1::IExecutionContext *context,
     return cuda_graph_.Launch(stream);
   }
 
-#if IS_TRT_VERSION_GE(8500)
-  for (size_t j = 0; j < buffers->size(); ++j) {
-    auto name = context->getEngine().getBindingName(j);
-    context->setTensorAddress(name, (*buffers)[j]);
-  }
-#endif
-
   bool ret;
   if (!with_dynamic_shape()) {
     ret = context->enqueue(batch_size, buffers->data(), stream, nullptr);

diff --git a/paddle/fluid/inference/tensorrt/test_dynamic_engine.cc b/paddle/fluid/inference/tensorrt/test_dynamic_engine.cc
@@ -131,17 +131,9 @@ TEST_F(TensorRTDynamicShapeValueEngineTest, test_trt_dynamic_shape_value) {
   std::vector<int> shape_v = {8, 8, 4};
   PrepareInputOutput(x_v, {8, 8, 4});
   PrepareShapeInput(shape_v);
-#if IS_TRT_VERSION_GE(6000)
-
-#if IS_TRT_VERSION_GE(8500)
-  engine_->context()->setInputShape("input", nvinfer1::Dims2{8, 32});
-  engine_->context()->setInputShape("shape", shape_dim);
-#else
   engine_->context()->setBindingDimensions(0, nvinfer1::Dims2{8, 32});
   engine_->context()->setBindingDimensions(1, shape_dim);
   engine_->context()->setInputShapeBinding(1, shape_v.data());
-#endif
-#endif
   auto *x_gpu_data = input_.mutable_data<float>(ctx_->GetPlace());
   auto *shape_gpu_data = shape_.mutable_data<int>(ctx_->GetPlace());
   auto *y_gpu_data = output_.mutable_data<float>(ctx_->GetPlace());

diff --git a/paddle/fluid/operators/tensorrt/tensorrt_engine_op.h b/paddle/fluid/operators/tensorrt/tensorrt_engine_op.h
@@ -703,6 +703,8 @@ class TensorRTEngineOp : public framework::OperatorBase {
             "The TRT Engine OP only support "
             "float/double/int32_t/int64_t/float16/bool input."));
       }
+      const char *binding_name = engine->engine()->getBindingName(bind_index);
+      trt_context->setTensorAddress(binding_name, buffers[bind_index]);
     }
 
     // Bind output tensor to TRT.
@@ -769,6 +771,8 @@ class TensorRTEngineOp : public framework::OperatorBase {
       buffers[bind_index] = static_cast<void *>(
           fluid_t->mutable_data(dev_place, TRT2FluidDataType(trt_type)));
       output_index += 1;
+      const char *binding_name = engine->engine()->getBindingName(bind_index);
+      trt_context->setTensorAddress(binding_name, buffers[bind_index]);
     }
 
     if (!engine->with_dynamic_shape()) {