remove CUDA 11.0 message in sparse/gpu

co63oc · co63oc · commit 4ea0a70c7f51 · 2026-01-06T13:51:26.000+08:00
diff --git a/paddle/phi/kernels/fusion/gpu/fused_gemm_epilogue_kernel.cu b/paddle/phi/kernels/fusion/gpu/fused_gemm_epilogue_kernel.cu
@@ -77,13 +77,7 @@ void FusedGemmEpilogueKernel(const Context& dev_ctx,
     dev_ctx.template Alloc<T>(out);
     return;
   }
-#if defined(PADDLE_WITH_CUDA) && CUDA_VERSION < 11060
-  PADDLE_THROW(common::errors::Unimplemented(
-      "The fused_gemm_epilogue operator only support CUDA 11.6 "
-      "or higher version."));
-#endif
-#if (defined(PADDLE_WITH_CUDA) && CUDA_VERSION >= 11060) || \
-    defined(PADDLE_WITH_HIP)
+#if defined(PADDLE_WITH_CUDA) || defined(PADDLE_WITH_HIP)
 
   dev_ctx.template Alloc<T>(out, out->numel() * sizeof(T));
   // (M * K) * (K * N)
diff --git a/paddle/phi/kernels/fusion/gpu/fused_layernorm_kernel.cu b/paddle/phi/kernels/fusion/gpu/fused_layernorm_kernel.cu
@@ -183,12 +183,12 @@ struct DefaultComputeType<half> {
   using type = float;
 };
 
-#if CUDA_VERSION >= 11000
+#if defined(PADDLE_WITH_CUDA)
 template <>
 struct DefaultComputeType<nv_bfloat16> {
   using type = float;
 };
-#endif  // CUDA_VERSION >= 11000
+#endif
 
 template <typename T>
 class HasCanPackAs {
diff --git a/paddle/phi/kernels/sparse/gpu/addmm_kernel.cu b/paddle/phi/kernels/sparse/gpu/addmm_kernel.cu
@@ -34,7 +34,7 @@ void AddmmKernelImpl(const Context& dev_ctx,
                      float beta,
                      float alpha,
                      DenseTensor* out) {
-#if CUDA_VERSION >= 11000
+#if defined(PADDLE_WITH_CUDA)
   std::vector<int64_t> input_dim = common::vectorize(input.dims());
   std::vector<int64_t> x_dim = common::vectorize(x.dims());
   std::vector<int64_t> y_dim = common::vectorize(y.dims());
@@ -95,10 +95,6 @@ void AddmmKernelImpl(const Context& dev_ctx,
   auto sparse_blas = funcs::sparse::GetSparseBlas<Context, T>(dev_ctx);
   sparse_blas.SPMM(
       false, false, static_cast<T>(alpha), x, y, static_cast<T>(beta), out);
-#else
-  PADDLE_THROW(common::errors::Unimplemented(
-      "forward of 'sparse.addmm' use cusparseSpMM, "
-      "which is supported from CUDA 11.0"));
 #endif
 }
 
diff --git a/paddle/phi/kernels/sparse/gpu/matmul_grad_kernel.cu b/paddle/phi/kernels/sparse/gpu/matmul_grad_kernel.cu
@@ -37,7 +37,7 @@ void MatmulCooDenseGradKernel(const Context& dev_ctx,
                               const DenseTensor& dout,
                               SparseCooTensor* dx,
                               DenseTensor* dy) {
-#if CUDA_VERSION >= 11030 || HIP_VERSION >= 403
+#if defined(PADDLE_WITH_CUDA) || HIP_VERSION >= 403
   auto sparse_blas = funcs::sparse::GetSparseBlas<Context, T>(dev_ctx);
 
   // dx{SparseCoo} = dout{Dense} * y'{Dense}
@@ -84,7 +84,7 @@ void MatmulCsrDenseGradKernel(const Context& dev_ctx,
                               const DenseTensor& dout,
                               SparseCsrTensor* dx,
                               DenseTensor* dy) {
-#if CUDA_VERSION >= 11030 || HIP_VERSION >= 403
+#if defined(PADDLE_WITH_CUDA) || HIP_VERSION >= 403
   auto sparse_blas = funcs::sparse::GetSparseBlas<Context, T>(dev_ctx);
 
   // dx{SparseCsr} = dout{Dense} * y'{Dense}
@@ -123,7 +123,7 @@ void MatmulCsrCsrGradKernel(const Context& dev_ctx,
                             const SparseCsrTensor& dout,
                             SparseCsrTensor* dx,
                             SparseCsrTensor* dy) {
-#if CUDA_VERSION >= 11000
+#if defined(PADDLE_WITH_CUDA)
   auto sparse_blas = funcs::sparse::GetSparseBlas<Context, T>(dev_ctx);
 
   std::vector<int64_t> xdim_vec = phi::vectorize(x.dims());
@@ -187,7 +187,7 @@ void MaskedMatmulCsrGradKernel(const Context& dev_ctx,
                                const SparseCsrTensor& dout,
                                DenseTensor* dx,
                                DenseTensor* dy) {
-#if CUDA_VERSION >= 11000
+#if defined(PADDLE_WITH_CUDA)
   auto sparse_blas = funcs::sparse::GetSparseBlas<Context, T>(dev_ctx);
 
   // dx{Dense} = dout{SparseCsr} * y'{Dense}
diff --git a/paddle/phi/kernels/sparse/gpu/matmul_kernel.cu b/paddle/phi/kernels/sparse/gpu/matmul_kernel.cu
@@ -39,7 +39,7 @@ void MatmulKernelImpl(const Context& dev_ctx,
                       const TensorType& x,
                       const DenseTensor& y,
                       DenseTensor* out) {
-#if CUDA_VERSION >= 11000 || HIP_VERSION >= 402
+#if defined(PADDLE_WITH_CUDA) || HIP_VERSION >= 402
   std::vector<int64_t> xdim_vec = common::vectorize(x.dims());
   std::vector<int64_t> ydim_vec = common::vectorize(y.dims());
   auto x_ndims = xdim_vec.size();
@@ -115,7 +115,7 @@ void MatmulCsrCsrKernel(const Context& dev_ctx,
                         const SparseCsrTensor& x,
                         const SparseCsrTensor& y,
                         SparseCsrTensor* out) {
-#if CUDA_VERSION >= 11000
+#if defined(PADDLE_WITH_CUDA)
   std::vector<int64_t> xdim_vec = phi::vectorize(x.dims());
   std::vector<int64_t> ydim_vec = phi::vectorize(y.dims());
   auto x_ndims = xdim_vec.size();
@@ -152,13 +152,6 @@ void MatmulCsrCsrKernel(const Context& dev_ctx,
   auto sparse_blas = funcs::sparse::GetSparseBlas<Context, T>(dev_ctx);
   sparse_blas.SPGEMM(
       false, false, static_cast<T>(1), x, y, static_cast<T>(0), out);
-
-#else
-#ifdef PADDLE_WITH_CUDA
-  PADDLE_THROW(common::errors::Unimplemented(
-      "forward of 'sparse.matmul' use cusparseSpGEMM, "
-      "which is supported from CUDA 11.0"));
-#endif
 #endif
 }
 
@@ -182,7 +175,7 @@ void MaskedMatmulCsrKernel(const Context& dev_ctx,
                            const DenseTensor& y,
                            const SparseCsrTensor& mask,
                            SparseCsrTensor* out) {
-#if CUDA_VERSION >= 11030
+#if defined(PADDLE_WITH_CUDA)
   std::vector<int64_t> xdim_vec = common::vectorize(x.dims());
   std::vector<int64_t> ydim_vec = common::vectorize(y.dims());
   std::vector<int64_t> maskdim_vec = common::vectorize(mask.dims());
@@ -252,10 +245,6 @@ void MaskedMatmulCsrKernel(const Context& dev_ctx,
   auto sparse_blas = funcs::sparse::GetSparseBlas<Context, T>(dev_ctx);
   sparse_blas.SDDMM(
       false, false, static_cast<T>(1), x, y, static_cast<T>(0), out);
-#else
-  PADDLE_THROW(common::errors::Unimplemented(
-      "forward of 'sparse.masked_matmul' use cusparseSDDMM, which is supported "
-      "from CUDA 11.3"));
 #endif
 }
 
diff --git a/paddle/phi/kernels/sparse/gpu/mv_grad_kernel.cu b/paddle/phi/kernels/sparse/gpu/mv_grad_kernel.cu
@@ -86,7 +86,7 @@ void MvCooGradKernel(const Context &dev_ctx,
 
   // dvec{Dense} = x'{SparseCoo} * dout{Dense}
   if (dvec) {
-#if CUDA_VERSION >= 11000
+#if defined(PADDLE_WITH_CUDA)
     // InferMeta of DenseTensor 'dvec'
     dvec->Resize(vec.dims());
     dev_ctx.template Alloc<T>(dvec);
@@ -130,7 +130,7 @@ void MvCsrGradKernel(const Context &dev_ctx,
 
   // dvec{Dense} = x'{SparseCsr} * dout{Dense}
   if (dvec) {
-#if CUDA_VERSION >= 11000
+#if defined(PADDLE_WITH_CUDA)
     // InferMeta of DenseTensor 'dvec'
     dvec->Resize(vec.dims());
     dev_ctx.template Alloc<T>(dvec);
diff --git a/paddle/phi/kernels/sparse/gpu/mv_kernel.cu b/paddle/phi/kernels/sparse/gpu/mv_kernel.cu
@@ -29,7 +29,7 @@ void MvKernelImpl(const Context& dev_ctx,
                   const TensorType& x,
                   const DenseTensor& vec,
                   DenseTensor* out) {
-#if CUDA_VERSION >= 11000
+#if defined(PADDLE_WITH_CUDA)
   std::vector<int64_t> x_dim = common::vectorize(x.dims());
   std::vector<int64_t> vec_dim = common::vectorize(vec.dims());
   auto x_ndims = x_dim.size();
diff --git a/paddle/phi/kernels/sparse/gpu/sparse_attention_kernel.cu b/paddle/phi/kernels/sparse/gpu/sparse_attention_kernel.cu
@@ -460,7 +460,7 @@ void DotSdd(const phi::GPUContext& dev_ctx,
             const int num_cols,
             const bool a_transpose,
             const bool b_transpose) {
-#if defined(PADDLE_WITH_CUDA) && CUDA_VERSION >= 11030
+#if defined(PADDLE_WITH_CUDA)
   const T* a_data = a->data<T>();
   const T* b_data = b->data<T>();
   const int* c_offset_data = c_offset->data<int>();
@@ -560,7 +560,7 @@ void DotDsd(const phi::GPUContext& dev_ctx,
             const int num_cols,
             const bool a_transpose,
             const bool b_transpose) {
-#if defined(PADDLE_WITH_CUDA) && CUDA_VERSION >= 11000
+#if defined(PADDLE_WITH_CUDA)
   const int* a_offset_data = a_offset->data<int>();
   const int* a_columns_data = a_columns->data<int>();
   const T* a_value_data = a_value->data<T>();