PaddlePaddle
diff --git a/‎paddle/fluid/inference/analysis/ir_passes/tensorrt_subgraph_pass.cc‎
Lines changed: 0 additions & 1 deletion b/‎paddle/fluid/inference/analysis/ir_passes/tensorrt_subgraph_pass.cc‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎paddle/fluid/inference/tensorrt/convert/test_op_converter.cc‎
Lines changed: 6 additions & 1 deletion b/‎paddle/fluid/inference/tensorrt/convert/test_op_converter.cc‎
Lines changed: 6 additions & 1 deletion
diff --git a/‎paddle/fluid/inference/tensorrt/engine.cc‎
Lines changed: 12 additions & 12 deletions b/‎paddle/fluid/inference/tensorrt/engine.cc‎
Lines changed: 12 additions & 12 deletions
diff --git a/‎paddle/fluid/inference/tensorrt/engine.h‎
Lines changed: 1 addition & 1 deletion b/‎paddle/fluid/inference/tensorrt/engine.h‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎paddle/fluid/inference/tensorrt/test_dynamic_engine.cc‎
Lines changed: 25 additions & 63 deletions b/‎paddle/fluid/inference/tensorrt/test_dynamic_engine.cc‎
Lines changed: 25 additions & 63 deletions
@@ -578,7 +578,6 @@ std::string TensorRtSubgraphPass::CreateTensorRTOp(
   op_desc->SetAttr("allow_build_at_runtime", allow_build_at_runtime);
   op_desc->SetAttr("shape_range_info_path", shape_range_info_path);
   op_desc->SetAttr("use_inspector", use_inspector);
-  op_desc->SetAttr("model_precision", Get<int>("model_precision"));
   op_desc->SetAttr("with_dynamic_shape", with_dynamic_shape);
   op_desc->SetAttr("enable_low_precision_io", enable_low_precision_io);
 
 
@@ -14,6 +14,8 @@ limitations under the License. */
 
 #include <gtest/gtest.h>  // NOLINT
 
+#include <memory>
+
 #include "paddle/fluid/framework/program_desc.h"
 #include "paddle/fluid/inference/tensorrt/convert/op_converter.h"
 
@@ -28,7 +30,10 @@ TEST(OpConverter, ConvertBlock) {
 
   // init trt engine
   std::unique_ptr<TensorRTEngine> engine_;
-  engine_.reset(new TensorRTEngine(5, 1 << 15));
+  TensorRTEngine::ConstructionParams params;
+  params.max_batch_size = 5;
+  params.max_workspace_size = 1 << 15;
+  engine_ = std::make_unique<TensorRTEngine>(params);
   engine_->InitNetwork();
 
   engine_->DeclareInput(
 
@@ -125,7 +125,7 @@ void TensorRTEngine::Execute(int batch_size,
         inference::Singleton<inference::tensorrt::TRTEngineManager>::Global()
             .getContextMemory(
                 predictor_id_per_thread,
-                phi::GPUPlace(params_.device_id),
+                phi::GPUPlace(device_id()),
                 phi::Stream(reinterpret_cast<phi::StreamId>(stream)));
     infer_context->setDeviceMemory(context_memory);
   }
@@ -202,7 +202,7 @@ void TensorRTEngine::FreezeNetwork() {
   infer_builder_config_->setMemoryPoolLimit(
       nvinfer1::MemoryPoolType::kWORKSPACE, params_.max_workspace_size);
 #else
-  infer_builder_config_->setMaxWorkspaceSize(max_workspace_);
+  infer_builder_config_->setMaxWorkspaceSize(params_.max_workspace_size);
 #endif
 
   bool enable_fp16 = (precision() == phi::DataType::FLOAT16);
@@ -290,11 +290,11 @@ void TensorRTEngine::FreezeNetwork() {
         if (!(std::all_of(input.second.begin(),
                           input.second.end(),
                           [](int x) { return x > 0; }) &&
-              std::all_of(max_input_shape_[input.first].begin(),
-                          max_input_shape_[input.first].end(),
+              std::all_of(max_input_shape()[input.first].begin(),
+                          max_input_shape()[input.first].end(),
                           [](int x) { return x > 0; }) &&
-              std::all_of(optim_input_shape_[input.first].begin(),
-                          optim_input_shape_[input.first].end(),
+              std::all_of(optim_input_shape()[input.first].begin(),
+                          optim_input_shape()[input.first].end(),
                           [](int x) { return x > 0; }))) {
           continue;
         }
@@ -322,9 +322,9 @@ void TensorRTEngine::FreezeNetwork() {
         auto input_name = network()->getInput(input_id)->getName();
         if (!itensor_map_.count(input_name)) continue;
         if (!GetITensor(input_name)->isShapeTensor()) continue;
-        PADDLE_ENFORCE_EQ(min_shape_tensor().count(input_name) &&
-                              max_shape_tensor().count(input_name) &&
-                              optim_shape_tensor().count(input_name),
+        PADDLE_ENFORCE_EQ(min_shape_tensor().count(input_name) > 0 &&
+                              max_shape_tensor().count(input_name) > 0 &&
+                              optim_shape_tensor().count(input_name) > 0,
                           true,
                           platform::errors::InvalidArgument(
                               "Fail to find min/max/optim shape value for TRT "
@@ -854,13 +854,13 @@ nvinfer1::IPluginV2Layer *TensorRTEngine::AddPluginV2IOExt(
 void TensorRTEngine::FreshDeviceId() {
   int count;
   cudaGetDeviceCount(&count);
-  PADDLE_ENFORCE_LT(params_.device_id,
+  PADDLE_ENFORCE_LT(device_id(),
                     count,
                     platform::errors::OutOfRange(
                         "Device id %d exceeds the current device count: %d.",
-                        params_.device_id,
+                        device_id(),
                         count));
-  platform::SetDeviceId(params_.device_id);
+  platform::SetDeviceId(device_id());
 }
 
 void TensorRTEngine::GetEngineInfo() {
 
@@ -418,7 +418,7 @@ class TensorRTEngine {
     return enable_int8 && support_int8;
   }
 
-  int GetDeviceId() { return params_.device_id; }
+  int device_id() { return params_.device_id; }
 
   nvinfer1::IPluginV2Layer* AddPlugin(nvinfer1::ITensor* const* inputs,
                                       int num_inputs,
 
@@ -36,7 +36,7 @@ namespace tensorrt {
 class TensorRTDynamicShapeValueEngineTest : public ::testing::Test {
  protected:
   void SetUp() override {
-    ctx_ = new phi::GPUContext(platform::CUDAPlace(0));
+    ctx_ = std::make_unique<phi::GPUContext>(platform::CUDAPlace(0));
     ctx_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
                            .GetAllocator(platform::CUDAPlace(0), ctx_->stream())
                            .get());
@@ -70,25 +70,19 @@ class TensorRTDynamicShapeValueEngineTest : public ::testing::Test {
     TensorRTEngine::ConstructionParams params;
     params.max_batch_size = 16;
     params.max_workspace_size = 1 << 10;
+    params.with_dynamic_shape = true;
     params.min_input_shape = min_input_shape;
     params.max_input_shape = max_input_shape;
     params.optim_input_shape = optim_input_shape;
     params.min_shape_tensor = min_input_value;
     params.max_shape_tensor = max_input_value;
     params.optim_shape_tensor = optim_input_value;
 
-    engine_ = new TensorRTEngine(params, NaiveLogger::Global());
+    engine_ = std::make_unique<TensorRTEngine>(params, NaiveLogger::Global());
 
     engine_->InitNetwork();
   }
 
-  void TearDown() override {
-    if (engine_) {
-      delete engine_;
-      engine_ = nullptr;
-    }
-  }
-
   void PrepareInputOutput(const std::vector<float> &input,
                           std::vector<int> output_shape) {
     paddle::framework::TensorFromVector(input, *ctx_, &input_);
@@ -105,8 +99,8 @@ class TensorRTDynamicShapeValueEngineTest : public ::testing::Test {
   phi::DenseTensor input_;
   phi::DenseTensor shape_;
   phi::DenseTensor output_;
-  TensorRTEngine *engine_;
-  phi::GPUContext *ctx_;
+  std::unique_ptr<TensorRTEngine> engine_;
+  std::unique_ptr<phi::GPUContext> ctx_;
 };
 
 TEST_F(TensorRTDynamicShapeValueEngineTest, test_trt_dynamic_shape_value) {
@@ -166,7 +160,7 @@ TEST_F(TensorRTDynamicShapeValueEngineTest, test_trt_dynamic_shape_value) {
 class TensorRTDynamicEngineTest : public ::testing::Test {
  protected:
   void SetUp() override {
-    ctx_ = new phi::GPUContext(platform::CUDAPlace(0));
+    ctx_ = std::make_unique<phi::GPUContext>(platform::CUDAPlace(0));
     ctx_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
                            .GetAllocator(platform::CUDAPlace(0), ctx_->stream())
                            .get());
@@ -195,23 +189,16 @@ class TensorRTDynamicEngineTest : public ::testing::Test {
     params.max_batch_size = 16;
     params.max_workspace_size = 1 << 10;
     params.with_dynamic_shape = true;
-    params.precision = phi::Datatype::FLOAT16;
+    params.precision = phi::DataType::FLOAT16;
     params.min_input_shape = min_input_shape;
     params.max_input_shape = max_input_shape;
     params.optim_input_shape = optim_input_shape;
 
-    engine_ = new TensorRTEngine(params, NaiveLogger::Global());
+    engine_ = std::make_unique<TensorRTEngine>(params, NaiveLogger::Global());
 
     engine_->InitNetwork();
   }
 
-  void TearDown() override {
-    if (engine_) {
-      delete engine_;
-      engine_ = nullptr;
-    }
-  }
-
   void PrepareInputOutput(const std::vector<float16> &input,
                           std::vector<int> output_shape) {
     paddle::framework::TensorFromVector(input, *ctx_, &input_);
@@ -225,8 +212,8 @@ class TensorRTDynamicEngineTest : public ::testing::Test {
  protected:
   phi::DenseTensor input_;
   phi::DenseTensor output_;
-  TensorRTEngine *engine_;
-  phi::GPUContext *ctx_;
+  std::unique_ptr<TensorRTEngine> engine_;
+  std::unique_ptr<phi::GPUContext> ctx_;
 };
 
 TEST_F(TensorRTDynamicEngineTest, test_spmm) {
@@ -331,7 +318,7 @@ TEST_F(TensorRTDynamicEngineTest, test_spmm) {
 class TensorRTDynamicTestFusedTokenPrune : public ::testing::Test {
  protected:
   void SetUp() override {
-    ctx_ = new phi::GPUContext(platform::CUDAPlace(0));
+    ctx_ = std::make_unique<phi::GPUContext>(platform::CUDAPlace(0));
     ctx_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
                            .GetAllocator(platform::CUDAPlace(0), ctx_->stream())
                            .get());
@@ -368,24 +355,17 @@ class TensorRTDynamicTestFusedTokenPrune : public ::testing::Test {
     TensorRTEngine::ConstructionParams params;
     params.max_batch_size = 16;
     params.max_workspace_size = 1 << 10;
-    params.precision = phi::Datatype::FLOAT32;
+    params.precision = phi::DataType::FLOAT32;
     params.with_dynamic_shape = true;
     params.min_input_shape = min_input_shape;
     params.max_input_shape = max_input_shape;
     params.optim_input_shape = optim_input_shape;
 
-    engine_ = new TensorRTEngine(params, NaiveLogger::Global());
+    engine_ = std::make_unique<TensorRTEngine>(params, NaiveLogger::Global());
 
     engine_->InitNetwork();
   }
 
-  void TearDown() override {
-    if (engine_) {
-      delete engine_;
-      engine_ = nullptr;
-    }
-  }
-
   void PrepareInputOutput(const std::vector<std::vector<float>> inputs,
                           std::vector<std::vector<int>> output_shapes) {
     LOG(INFO) << "PrepareInputOutput";
@@ -410,13 +390,12 @@ class TensorRTDynamicTestFusedTokenPrune : public ::testing::Test {
  protected:
   std::vector<phi::DenseTensor> inputs_;
   std::vector<phi::DenseTensor> outputs_;
-  TensorRTEngine *engine_;
-  phi::GPUContext *ctx_;
+  std::unique_ptr<TensorRTEngine> engine_;
+  std::unique_ptr<phi::GPUContext> ctx_;
 };
 
 TEST_F(TensorRTDynamicTestFusedTokenPrune, test_fused_token_prune) {
 #if IS_TRT_VERSION_GE(8000)
-  tensorrt::plugin::TrtPluginRegistry::Global()->RegistToTrt();
   auto *attn = engine_->DeclareInput(
       "attn", nvinfer1::DataType::kFLOAT, nvinfer1::Dims2{-1, 4});
   auto *x = engine_->DeclareInput(
@@ -536,7 +515,7 @@ TEST_F(TensorRTDynamicTestFusedTokenPrune, test_fused_token_prune) {
 class TensorRTDynamicTestFusedTokenPruneHalf : public ::testing::Test {
  protected:
   void SetUp() override {
-    ctx_ = new phi::GPUContext(platform::CUDAPlace(0));
+    ctx_ = std::make_unique<phi::GPUContext>(platform::CUDAPlace(0));
     ctx_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
                            .GetAllocator(platform::CUDAPlace(0), ctx_->stream())
                            .get());
@@ -573,23 +552,16 @@ class TensorRTDynamicTestFusedTokenPruneHalf : public ::testing::Test {
     TensorRTEngine::ConstructionParams params;
     params.max_batch_size = 16;
     params.max_workspace_size = 1 << 10;
-    params.precision = phi::Datatype::FLOAT16;
+    params.precision = phi::DataType::FLOAT16;
     params.with_dynamic_shape = true;
     params.min_input_shape = min_input_shape;
     params.max_input_shape = max_input_shape;
     params.optim_input_shape = optim_input_shape;
 
-    engine_ = new TensorRTEngine(params, NaiveLogger::Global());
+    engine_ = std::make_unique<TensorRTEngine>(params, NaiveLogger::Global());
     engine_->InitNetwork();
   }
 
-  void TearDown() override {
-    if (engine_) {
-      delete engine_;
-      engine_ = nullptr;
-    }
-  }
-
   void PrepareInputOutput(const std::vector<std::vector<float16>> inputs,
                           std::vector<std::vector<int>> output_shapes) {
     LOG(INFO) << "PrepareInputOutput";
@@ -614,13 +586,12 @@ class TensorRTDynamicTestFusedTokenPruneHalf : public ::testing::Test {
  protected:
   std::vector<phi::DenseTensor> inputs_;
   std::vector<phi::DenseTensor> outputs_;
-  TensorRTEngine *engine_;
-  phi::GPUContext *ctx_;
+  std::unique_ptr<TensorRTEngine> engine_;
+  std::unique_ptr<phi::GPUContext> ctx_;
 };
 
 TEST_F(TensorRTDynamicTestFusedTokenPruneHalf, test_fused_token_prune) {
 #if IS_TRT_VERSION_GE(8000)
-  tensorrt::plugin::TrtPluginRegistry::Global()->RegistToTrt();
   auto *attn = engine_->DeclareInput(
       "attn", nvinfer1::DataType::kHALF, nvinfer1::Dims2{-1, 4});
   auto *x = engine_->DeclareInput(
@@ -740,7 +711,7 @@ TEST_F(TensorRTDynamicTestFusedTokenPruneHalf, test_fused_token_prune) {
 class TensorRTDynamicShapeGNTest : public ::testing::Test {
  protected:
   void SetUp() override {
-    ctx_ = new phi::GPUContext(platform::CUDAPlace(0));
+    ctx_ = std::make_unique<phi::GPUContext>(platform::CUDAPlace(0));
     ctx_->SetAllocator(paddle::memory::allocation::AllocatorFacade::Instance()
                            .GetAllocator(platform::CUDAPlace(0), ctx_->stream())
                            .get());
@@ -771,24 +742,17 @@ class TensorRTDynamicShapeGNTest : public ::testing::Test {
     TensorRTEngine::ConstructionParams params;
     params.max_batch_size = 16;
     params.max_workspace_size = 1 << 10;
-    params.precision = phi::Datatype::INT8;
+    params.precision = phi::DataType::INT8;
     params.with_dynamic_shape = true;
     params.min_input_shape = min_input_shape;
     params.max_input_shape = max_input_shape;
     params.optim_input_shape = optim_input_shape;
 
-    engine_ = new TensorRTEngine(params);
+    engine_ = std::make_unique<TensorRTEngine>(params, NaiveLogger::Global());
 
     engine_->InitNetwork();
   }
 
-  void TearDown() override {
-    if (engine_) {
-      delete engine_;
-      engine_ = nullptr;
-    }
-  }
-
   void PrepareInputOutput(const std::vector<float> &input,
                           std::vector<int> output_shape) {
     paddle::framework::TensorFromVector(input, *ctx_, &x_);
@@ -905,8 +869,8 @@ class TensorRTDynamicShapeGNTest : public ::testing::Test {
  protected:
   phi::DenseTensor x_;
   phi::DenseTensor y_;
-  TensorRTEngine *engine_;
-  phi::GPUContext *ctx_;
+  std::unique_ptr<TensorRTEngine> engine_;
+  std::unique_ptr<phi::GPUContext> ctx_;
   // case from SD
   int n_ = 2;
   int c_ = 320;
@@ -924,8 +888,6 @@ class TensorRTDynamicShapeGNTest : public ::testing::Test {
 
 /*
 TEST_F(TensorRTDynamicShapeGNTest, test_trt_dynamic_shape_groupnorm) {
-  tensorrt::plugin::TrtPluginRegistry::Global()->RegistToTrt();
-
   float *bias = new float[c_];
   float *scale = new float[c_];
   for (int i = 0; i < c_; i++) {
Original file line number	Diff line number	Diff line change
`@@ -418,7 +418,7 @@ class TensorRTEngine {`
`418`	`418`	`return enable_int8 && support_int8;`
`419`	`419`	`}`
`420`	`420`
`421`		`- int GetDeviceId() { return params_.device_id; }`
	`421`	`+ int device_id() { return params_.device_id; }`
`422`	`422`
`423`	`423`	`nvinfer1::IPluginV2Layer* AddPlugin(nvinfer1::ITensor* const* inputs,`
`424`	`424`	`int num_inputs,`