apache · vicennial · Mar 6, 2025 · Mar 6, 2025 · Mar 6, 2025 · Mar 7, 2025
diff --git a/sql/connect/common/src/main/protobuf/spark/connect/base.proto b/sql/connect/common/src/main/protobuf/spark/connect/base.proto
@@ -399,6 +399,10 @@ message ExecutePlanResponse {
     // ML command response
     MlCommandResult ml_command_result = 20;
 
+    // Acknowledgement sent by the server immediately upon registration of an ExecutePlan or
+    // ReattachExecute request.
+    Acknowledgement acknowledgement = 21;
+
     // Support arbitrary result objects.
     google.protobuf.Any extension = 999;
   }
@@ -477,6 +481,15 @@ message ExecutePlanResponse {
       bool done = 5;
     }
   }
+
+  message Acknowledgement {
+    // Server acknowledgement sent immediately upon registering an ExecutePlan or ReattachExecute
+    // request.
+    // This acknowledgement allows a client to disconnect right after registration, without waiting
+    // for the full processing of the request.
+    // It is especially useful when the server supports reattachment or otherwise, early termination
+    // of the request.
+  }
 }
 
 // The key-value pair for the config request and response.

diff --git a/...ver/src/main/scala/org/apache/spark/sql/connect/execution/ExecuteGrpcResponseSender.scala b/...ver/src/main/scala/org/apache/spark/sql/connect/execution/ExecuteGrpcResponseSender.scala
@@ -190,6 +190,18 @@ private[connect] class ExecuteGrpcResponseSender[T <: Message](
     deadlineTimeNs = startTime + (1000L * 60L * 60L * 24L * 180L * NANOS_PER_MILLIS)
   }
 
+  /**
+   * Enqueue an acknowledgement message to the response observer.
+   */
+  private def enqueueAckResponse(): Unit = {
+    logDebug(s"Enqueue acknowledgement for opId=${executeHolder.operationId}")
+    val ackResponse = ExecutePlanResponse
+      .newBuilder()
+      .setAcknowledgement(ExecutePlanResponse.Acknowledgement.newBuilder().build())
+      .build()
+    executeHolder.responseObserver.tryOnNext(ackResponse)
+  }
+
   /**
    * Attach to the executionObserver, consume responses from it, and send them to grpcObserver.
    *
@@ -203,6 +215,7 @@ private[connect] class ExecuteGrpcResponseSender[T <: Message](
    *   that. 0 means start from beginning (since first response has index 1)
    */
   def execute(lastConsumedStreamIndex: Long): Unit = {
+    enqueueAckResponse()
     logInfo(
       log"Starting for opId=${MDC(OP_ID, executeHolder.operationId)}, " +
         log"reattachable=${MDC(REATTACHABLE, executeHolder.reattachable)}, " +

diff --git a/...rver/src/test/scala/org/apache/spark/sql/connect/execution/ReattachableExecuteSuite.scala b/...rver/src/test/scala/org/apache/spark/sql/connect/execution/ReattachableExecuteSuite.scala
@@ -452,4 +452,21 @@ class ReattachableExecuteSuite extends SparkConnectServerTest {
       assert(re.getMessage.contains("INVALID_HANDLE.OPERATION_NOT_FOUND"))
     }
   }
+
+  test("Acknowledgement message is received") {
+    withRawBlockingStub { stub =>
+      val operationId = UUID.randomUUID().toString
+      val iter = stub.executePlan(
+        buildExecutePlanRequest(buildPlan(MEDIUM_RESULTS_QUERY), operationId = operationId))
+      val response = iter.next()
+      assert(response.hasAcknowledgement)
+      assert(!iter.next().hasAcknowledgement)
+
+      // send reattach
+      val iter2 = stub.reattachExecute(buildReattachExecuteRequest(operationId, None))
+      val reattachResponse = iter2.next()
+      assert(reattachResponse.hasAcknowledgement)
+      assert(!iter2.next().hasAcknowledgement)
+    }
+  }
 }
diff --git a/...server/src/test/scala/org/apache/spark/sql/connect/planner/SparkConnectServiceSuite.scala b/...server/src/test/scala/org/apache/spark/sql/connect/planner/SparkConnectServiceSuite.scala
@@ -201,7 +201,8 @@ class SparkConnectServiceSuite
       assert(done)
 
       // 4 Partitions + Metrics + optional progress messages
-      val filteredResponses = responses.filter(!_.hasExecutionProgress)
+      val filteredResponses =
+        responses.filter(x => !(x.hasExecutionProgress || x.hasAcknowledgement))
       assert(filteredResponses.size == 6)
 
       // Make sure the first response is schema only
@@ -302,7 +303,8 @@ class SparkConnectServiceSuite
       assert(done)
 
       // 1 Partitions + Metrics
-      val filteredResponses = responses.filter(!_.hasExecutionProgress)
+      val filteredResponses =
+        responses.filter(x => !(x.hasExecutionProgress || x.hasAcknowledgement))
       assert(filteredResponses.size == 3)
 
       // Make sure the first response is schema only
@@ -358,7 +360,8 @@ class SparkConnectServiceSuite
       assert(done)
 
       // 1 schema + 1 metric + at least 2 data batches
-      val filteredResponses = responses.filter(!_.hasExecutionProgress)
+      val filteredResponses =
+        responses.filter(x => !(x.hasExecutionProgress || x.hasAcknowledgement))
       assert(filteredResponses.size > 3)
 
       val allocator = new RootAllocator()
@@ -539,7 +542,8 @@ class SparkConnectServiceSuite
       assert(done)
 
       // Result + Metrics
-      val filteredResponses = responses.filter(!_.hasExecutionProgress)
+      val filteredResponses =
+        responses.filter(x => !(x.hasExecutionProgress || x.hasAcknowledgement))
       if (filteredResponses.size > 1) {
         assert(filteredResponses.size == 2)
 
@@ -793,7 +797,8 @@ class SparkConnectServiceSuite
       // The current implementation is expected to be blocking. This is here to make sure it is.
       assert(done)
 
-      val filteredResponses = responses.filter(!_.hasExecutionProgress)
+      val filteredResponses =
+        responses.filter(x => !(x.hasExecutionProgress || x.hasAcknowledgement))
       assert(filteredResponses.size == 7)
 
       // Make sure the first response is schema only