optimize code

Zjq9409 · Zjq9409 · commit b6226844c5ad · 2022-03-11T07:52:08.000Z
diff --git a/paddle/phi/kernels/cpu/matrix_rank_kernel.cc b/paddle/phi/kernels/cpu/matrix_rank_kernel.cc
@@ -12,10 +12,12 @@
 // See the License for the specific language governing permissions and
 // limitations under the License.
 
-#include "paddle/fluid/framework/tensor_util.h"
-#include "paddle/phi/core/kernel_registry.h"
+#include "paddle/phi/kernels/matrix_rank_kernel.h"
 #include "paddle/phi/kernels/matrix_rank_tol_kernel.h"
 
+#include "paddle/phi/core/kernel_registry.h"
+#include "paddle/phi/kernels/full_kernel.h"
+
 namespace phi {
 
 template <typename T, typename Context>
@@ -27,11 +29,9 @@ void MatrixRankKernel(const Context& dev_ctx,
                       DenseTensor* out) {
   DenseTensor atol_tensor;
   if (use_default_tol) {
-    paddle::framework::TensorFromVector(
-        std::vector<T>{0}, dev_ctx, &atol_tensor);
+    atol_tensor = phi::Full<T, Context>(dev_ctx, {1}, static_cast<T>(0));
   } else {
-    paddle::framework::TensorFromVector(
-        std::vector<T>{tol}, dev_ctx, &atol_tensor);
+    atol_tensor = phi::Full<T, Context>(dev_ctx, {1}, static_cast<T>(tol));
   }
   MatrixRankTolKernel<T, Context>(
       dev_ctx, x, atol_tensor, use_default_tol, hermitian, out);
diff --git a/paddle/phi/kernels/cpu/matrix_rank_tol_kernel.cc b/paddle/phi/kernels/cpu/matrix_rank_tol_kernel.cc
@@ -12,11 +12,10 @@
 // See the License for the specific language governing permissions and
 // limitations under the License.
 
+#include "paddle/phi/kernels/matrix_rank_tol_kernel.h"
+
 #include <Eigen/Dense>
 #include <Eigen/SVD>
-#include <memory>
-#include <string>
-#include <vector>
 #include "paddle/phi/core/ddim.h"
 #include "paddle/phi/core/kernel_registry.h"
 #include "paddle/phi/kernels/cpu/reduce.h"
@@ -124,8 +123,9 @@ void MatrixRankTolKernel(const Context& dev_ctx,
                              &max_eigenvalue_tensor);
 
   DenseTensor temp_rtol_tensor;
-  paddle::framework::TensorFromVector<T>(std::vector<T>{rtol_T},
-                                         &temp_rtol_tensor);
+  temp_rtol_tensor =
+      phi::Full<T, Context>(dev_ctx, {1}, static_cast<T>(rtol_T));
+
   DenseTensor rtol_tensor =
       phi::Multiply<T>(dev_ctx, temp_rtol_tensor, max_eigenvalue_tensor);
 
@@ -163,12 +163,13 @@ void MatrixRankTolKernel(const Context& dev_ctx,
         funcs::LessThanFunctor<T, int64_t>(),
         &compare_result);
   }
-  DenseTensor result = phi::Sum<int64_t>(dev_ctx,
-                                         compare_result,
-                                         std::vector<int64_t>{-1},
-                                         compare_result.dtype(),
-                                         false);
-  out->ShareDataWith(result);
+
+  phi::SumKernel<int64_t>(dev_ctx,
+                          compare_result,
+                          std::vector<int64_t>{-1},
+                          compare_result.dtype(),
+                          false,
+                          out);
 }
 }  // namespace phi
 
diff --git a/paddle/phi/kernels/gpu/matrix_rank_kernel.cu b/paddle/phi/kernels/gpu/matrix_rank_kernel.cu
@@ -15,10 +15,12 @@
 #ifndef PADDLE_WITH_HIP
 // HIP not support cusolver
 
-#include "paddle/fluid/framework/tensor_util.h"
-#include "paddle/phi/core/kernel_registry.h"
+#include "paddle/phi/kernels/matrix_rank_kernel.h"
 #include "paddle/phi/kernels/matrix_rank_tol_kernel.h"
 
+#include "paddle/phi/core/kernel_registry.h"
+#include "paddle/phi/kernels/full_kernel.h"
+
 namespace phi {
 
 template <typename T, typename Context>
@@ -30,11 +32,9 @@ void MatrixRankKernel(const Context& dev_ctx,
                       DenseTensor* out) {
   DenseTensor atol_tensor;
   if (use_default_tol) {
-    paddle::framework::TensorFromVector(
-        std::vector<T>{0}, dev_ctx, &atol_tensor);
+    atol_tensor = phi::Full<T, Context>(dev_ctx, {1}, static_cast<T>(0));
   } else {
-    paddle::framework::TensorFromVector(
-        std::vector<T>{tol}, dev_ctx, &atol_tensor);
+    atol_tensor = phi::Full<T, Context>(dev_ctx, {1}, static_cast<T>(tol));
   }
   MatrixRankTolKernel<T, Context>(
       dev_ctx, x, atol_tensor, use_default_tol, hermitian, out);
diff --git a/paddle/phi/kernels/gpu/matrix_rank_tol_kernel.cu b/paddle/phi/kernels/gpu/matrix_rank_tol_kernel.cu
@@ -15,12 +15,15 @@
 #ifndef PADDLE_WITH_HIP
 // HIP not support cusolver
 
+#include "paddle/phi/kernels/matrix_rank_tol_kernel.h"
+
 #include <algorithm>
 #include <vector>
 #include "paddle/fluid/memory/memory.h"
 #include "paddle/phi/backends/dynload/cusolver.h"
 #include "paddle/phi/backends/gpu/gpu_context.h"
 #include "paddle/phi/core/kernel_registry.h"
+#include "paddle/phi/kernels/abs_kernel.h"
 #include "paddle/phi/kernels/full_kernel.h"
 #include "paddle/phi/kernels/funcs/broadcast_function.h"
 #include "paddle/phi/kernels/funcs/compare_functors.h"
@@ -350,10 +353,9 @@ void MatrixRankTolKernel(const Context& dev_ctx,
   if (hermitian) {
     SyevjBatched<T>(
         dev_ctx, batches, rows, x_tmp.data<T>(), eigenvalue_data, info_ptr);
-    phi::funcs::ForRange<Context> for_range(dev_ctx, eigenvalue_tensor.numel());
-    phi::funcs::AbsFunctor<T> functor(
-        eigenvalue_data, eigenvalue_data, eigenvalue_tensor.numel());
-    for_range(functor);
+
+    phi::AbsKernel<T, Context>(dev_ctx, eigenvalue_tensor, &eigenvalue_tensor);
+
   } else {
     DenseTensor U, VH;
     U.Resize(detail::GetUDDim(dim_x, k));
@@ -384,8 +386,8 @@ void MatrixRankTolKernel(const Context& dev_ctx,
                              &max_eigenvalue_tensor);
 
   DenseTensor temp_rtol_tensor;
-  paddle::framework::TensorFromVector<T>(
-      std::vector<T>{rtol_T}, dev_ctx, &temp_rtol_tensor);
+  temp_rtol_tensor =
+      phi::Full<T, Context>(dev_ctx, {1}, static_cast<T>(rtol_T));
 
   DenseTensor rtol_tensor =
       phi::Multiply<T>(dev_ctx, temp_rtol_tensor, max_eigenvalue_tensor);
@@ -416,13 +418,12 @@ void MatrixRankTolKernel(const Context& dev_ctx,
       funcs::GreaterThanFunctor<T, int64_t>(),
       &compare_result);
 
-  DenseTensor result = phi::Sum<int64_t>(dev_ctx,
-                                         compare_result,
-                                         std::vector<int64_t>{-1},
-                                         compare_result.type(),
-                                         false);
-
-  out->ShareDataWith(result);
+  phi::SumKernel<int64_t>(dev_ctx,
+                          compare_result,
+                          std::vector<int64_t>{-1},
+                          compare_result.dtype(),
+                          false,
+                          out);
 }
 
 }  // namespace phi
diff --git a/paddle/phi/kernels/impl/matrix_rank_kernel_impl.h b/paddle/phi/kernels/impl/matrix_rank_kernel_impl.h
@@ -19,7 +19,6 @@
 
 namespace phi {
 
-using DDim = phi::DDim;
 namespace detail {
 static DDim GetEigenvalueDim(const DDim& dim, int k) {
   auto vec = phi::vectorize(dim);
diff --git a/paddle/phi/kernels/matrix_rank_kernel.h b/paddle/phi/kernels/matrix_rank_kernel.h
@@ -14,11 +14,8 @@ limitations under the License. */
 
 #pragma once
 
-#include "paddle/phi/common/scalar.h"
 #include "paddle/phi/core/dense_tensor.h"
-#include "paddle/phi/core/selected_rows.h"
-#include "paddle/phi/infermeta/unary.h"
-#include "paddle/phi/kernels/empty_kernel.h"
+
 namespace phi {
 
 template <typename T, typename Context>
diff --git a/paddle/phi/kernels/matrix_rank_tol_kernel.h b/paddle/phi/kernels/matrix_rank_tol_kernel.h
@@ -14,11 +14,8 @@ limitations under the License. */
 
 #pragma once
 
-#include "paddle/phi/common/scalar.h"
 #include "paddle/phi/core/dense_tensor.h"
-#include "paddle/phi/core/selected_rows.h"
-#include "paddle/phi/infermeta/unary.h"
-#include "paddle/phi/kernels/empty_kernel.h"
+
 namespace phi {
 
 template <typename T, typename Context>