pytorch
diff --git a/‎backends/qualcomm/_passes/layout_transform.py‎
Lines changed: 3 additions & 0 deletions b/‎backends/qualcomm/_passes/layout_transform.py‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎backends/qualcomm/builders/README.md‎
Lines changed: 1 addition & 1 deletion b/‎backends/qualcomm/builders/README.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎backends/qualcomm/builders/__init__.py‎
Lines changed: 4 additions & 0 deletions b/‎backends/qualcomm/builders/__init__.py‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎backends/qualcomm/builders/op_adaptive_max_pool2d.py‎
Lines changed: 151 additions & 0 deletions b/‎backends/qualcomm/builders/op_adaptive_max_pool2d.py‎
Lines changed: 151 additions & 0 deletions
diff --git a/‎backends/qualcomm/builders/op_grid_sampler_2d.py‎
Lines changed: 162 additions & 0 deletions b/‎backends/qualcomm/builders/op_grid_sampler_2d.py‎
Lines changed: 162 additions & 0 deletions
diff --git a/‎backends/qualcomm/builders/qnn_constants.py‎
Lines changed: 18 additions & 0 deletions b/‎backends/qualcomm/builders/qnn_constants.py‎
Lines changed: 18 additions & 0 deletions
@@ -42,8 +42,11 @@ class LayoutTransform(ExportPass):
 
     layout_sensitive_ops = {
         exir_ops.edge.aten.adaptive_avg_pool2d.default,
+        exir_ops.edge.aten.adaptive_max_pool2d.default,
         exir_ops.edge.aten.avg_pool2d.default,
         exir_ops.edge.aten.convolution.default,
+        exir_ops.edge.aten.grid_sampler_2d.default,
+        exir_ops.edge.aten.grid_sampler_3d.default,
         exir_ops.edge.aten.instance_norm.default,
         exir_ops.edge.aten.max_pool2d_with_indices.default,
         exir_ops.edge.aten._native_batch_norm_legit_no_training.default,
 
@@ -431,7 +431,7 @@ Please help update following table if you are contributing new operators:
 | Gelu | &check; |
 | GetSparseIndices | &cross; |
 | GetSparseValues | &cross; |
-| GridSample | &cross; |
+| GridSample | &check; |
 | GroupNorm | &check; |
 | HardSwish | &check; |
 | InstanceNorm | &check; |
 
@@ -8,6 +8,7 @@
     node_visitor,
     op_abs,
     op_adaptive_avg_pool2d,
+    op_adaptive_max_pool2d,
     op_add,
     op_amax,
     op_amin,
@@ -43,6 +44,7 @@
     op_gather,
     op_ge,
     op_gelu,
+    op_grid_sampler_2d,
     op_group_norm,
     op_gt,
     op_hardsigmoid,
@@ -113,6 +115,7 @@
     node_visitor,
     op_abs,
     op_adaptive_avg_pool2d,
+    op_adaptive_max_pool2d,
     op_add,
     op_amax,
     op_amin,
@@ -148,6 +151,7 @@
     op_gather,
     op_ge,
     op_gelu,
+    op_grid_sampler_2d,
     op_group_norm,
     op_gt,
     op_hardswish,
 
@@ -0,0 +1,151 @@
+# Copyright (c) Qualcomm Innovation Center, Inc.
+# All rights reserved
+#
+# This source code is licensed under the BSD-style license found in the
+# LICENSE file in the root directory of this source tree.
+import warnings
+from typing import cast, Dict, List
+
+import executorch.backends.qualcomm.python.PyQnnWrapperAdaptor as PyQnnWrapper
+import numpy as np
+
+import torch
+from executorch.backends.qualcomm.utils.constants import QCOM_DATA
+
+from .node_visitor import NodeVisitor
+from .node_visitor_manager import register_node_visitor
+from .qnn_constants import OpPoolMax2d, QNN_OP_PACKAGE_NAME_QTI_AISW
+
+
+@register_node_visitor
+class AdaptiveMaxPool2D(NodeVisitor):
+    target = ["aten.adaptive_max_pool2d.default"]
+
+    def __init__(self, *args) -> None:
+        super().__init__(*args)
+
+    def define_node(
+        self,
+        node: torch.fx.Node,
+        nodes_to_wrappers: Dict[torch.fx.Node, PyQnnWrapper.TensorWrapper],
+    ) -> PyQnnWrapper.PyQnnOpWrapper:
+        input_node = self.get_node(node.args[0])
+        input_tensor = self.get_tensor(input_node, node)
+        input_tensor_wrapper = self.define_tensor(
+            input_node,
+            node,
+            input_tensor,
+            PyQnnWrapper.Qnn_TensorType_t.QNN_TENSOR_TYPE_NATIVE,
+            nodes_to_wrappers,
+        )
+        users = list(node.users.keys())
+        for user in users:
+            if user.target.__name__ == "getitem":
+                getitem_index = user.args[1]
+                if getitem_index != 0:
+                    warnings.warn(
+                        f"[QNN Delegate Op Builder]: Expected second argument of getitem node for {node.target.__name__ } to be 0, got {getitem_index}",
+                        stacklevel=1,
+                    )
+                    return
+
+        if len(node.args) > 2:
+            warnings.warn(
+                "[QNN Delegate Op Builder]: The return_indices is not supported, fallback op",
+                stacklevel=1,
+            )
+            return
+
+        input_height = input_tensor.shape[1]
+        input_width = input_tensor.shape[2]
+        # output cases
+        out_wh = cast(List[int], node.args[1])
+        if len(out_wh) == 1:
+            output_height = node.args[1][0]
+            output_width = node.args[1][0]
+        else:
+            output_height = node.args[1][0]
+            output_width = node.args[1][1]
+        if output_height is None:
+            output_height = input_height
+        if output_width is None:
+            output_width = input_width
+        # NOTE: Here we need not to emphasize on mode, cuz the output shape is decided by user.
+        mode = OpPoolMax2d.RoundingMode.FLOOR
+
+        # floor division
+        stride_height = input_height // output_height
+        filter_height = input_height - (output_height - 1) * stride_height
+        stride_width = input_width // output_width
+        filter_width = input_width - (output_width - 1) * stride_width
+
+        filter = [filter_height, filter_width]
+        filter_shape = [len(filter)]
+
+        stride = [stride_height, stride_width]
+        stride_shape = [len(stride)]
+
+        padding = [0, 0]
+        padding_shape = [len(padding), len(padding)]
+
+        out_tensor = self.get_tensor(node, node, 0)
+        output_tensor_wrapper = self.define_tensor(
+            node,
+            node,
+            out_tensor,
+            PyQnnWrapper.Qnn_TensorType_t.QNN_TENSOR_TYPE_NATIVE,
+            nodes_to_wrappers,
+        )
+
+        adaptive_max_pool2d_op = PyQnnWrapper.PyQnnOpWrapper(
+            node.name,
+            QNN_OP_PACKAGE_NAME_QTI_AISW,
+            OpPoolMax2d.op_name,
+        )
+
+        adaptive_max_pool2d_op.AddInputTensors([input_tensor_wrapper])
+        adaptive_max_pool2d_op.AddOutputTensors([output_tensor_wrapper])
+
+        adaptive_max_pool2d_op.AddTensorParam(
+            OpPoolMax2d.param_filter_size,
+            PyQnnWrapper.Qnn_DataType_t.QNN_DATATYPE_UINT_32,
+            len(filter_shape),
+            filter_shape,
+            np.array(
+                filter,
+                dtype=np.uint32,
+            ),
+            True,
+        )
+
+        adaptive_max_pool2d_op.AddTensorParam(
+            OpPoolMax2d.param_stride,
+            PyQnnWrapper.Qnn_DataType_t.QNN_DATATYPE_UINT_32,
+            len(stride_shape),
+            stride_shape,
+            np.array(
+                stride,
+                dtype=np.uint32,
+            ),
+            True,
+        )
+
+        adaptive_max_pool2d_op.AddTensorParam(
+            OpPoolMax2d.param_pad_amount,
+            PyQnnWrapper.Qnn_DataType_t.QNN_DATATYPE_UINT_32,
+            len(padding_shape),
+            padding_shape,
+            np.array(
+                [[padding[0], padding[0]], [padding[1], padding[1]]],
+                dtype=np.uint32,
+            ),
+            True,
+        )
+
+        adaptive_max_pool2d_op.AddScalarParam(
+            OpPoolMax2d.param_rounding_mode,
+            PyQnnWrapper.Qnn_DataType_t.QNN_DATATYPE_UINT_32,
+            {QCOM_DATA: np.uint32(mode)},
+        )
+
+        return adaptive_max_pool2d_op
@@ -0,0 +1,162 @@
+# Copyright (c) Qualcomm Innovation Center, Inc.
+# All rights reserved
+#
+# This source code is licensed under the BSD-style license found in the
+# LICENSE file in the root directory of this source tree.
+import warnings
+from typing import cast, Dict, List
+
+import executorch.backends.qualcomm.python.PyQnnWrapperAdaptor as PyQnnWrapper
+import numpy as np
+
+import torch
+
+from executorch.backends.qualcomm.utils.constants import QCOM_DATA, QCOM_DTYPE
+
+from .node_visitor import NodeVisitor, QNN_QUANT_TYPE_MAP, QNN_TENSOR_TYPE_MAP
+from .node_visitor_manager import register_node_visitor
+from .qnn_constants import OpGridSample, OpTranspose, QNN_OP_PACKAGE_NAME_QTI_AISW
+
+
+@register_node_visitor
+class GridSample(NodeVisitor):
+    target = ["aten.grid_sampler_2d.default", "aten.grid_sampler_3d.default"]
+
+    def __init__(self, *args) -> None:
+        super().__init__(*args)
+
+    def define_node(
+        self,
+        node: torch.fx.Node,
+        nodes_to_wrappers: Dict[torch.fx.Node, PyQnnWrapper.TensorWrapper],
+    ) -> PyQnnWrapper.PyQnnOpWrapper:
+        grid_sample_op_list = []
+        input_node = self.get_node(node.args[0])
+        input_tensor = self.get_tensor(input_node, node)
+        input_tensor_wrapper = self.define_tensor(
+            input_node,
+            node,
+            input_tensor,
+            PyQnnWrapper.Qnn_TensorType_t.QNN_TENSOR_TYPE_NATIVE,
+            nodes_to_wrappers,
+        )
+
+        grid_node = self.get_node(node.args[1])
+        grid_tensor = self.get_tensor(grid_node, node)
+        grid_tensor_wrapper = self.define_tensor(
+            grid_node,
+            node,
+            grid_tensor,
+            PyQnnWrapper.Qnn_TensorType_t.QNN_TENSOR_TYPE_NATIVE,
+            nodes_to_wrappers,
+        )
+
+        input_shape = input_node.meta["val"].shape
+        input_rank = len(input_shape)
+        if input_rank not in [4, 5]:
+            warnings.warn(
+                "[QNN Delegate Op Builder]: The shape is not supported, fallback op",
+                stacklevel=1,
+            )
+            return
+
+        # About this operator, in ATen, the layout of input_tensor and of grid_tensor are not identical.
+        # But in HW they are all NHWC or NDHWC. So, we make shape transformation again.
+        if input_rank == 4:
+            dims_shape_back = (0, 3, 1, 2)
+        elif input_rank == 5:
+            dims_shape_back = (0, 4, 1, 2, 3)
+        else:
+            warnings.warn(
+                f"[QNN Delegate Op Builder]: Not support rank {input_rank}, fallback op",
+                stacklevel=1,
+            )
+            return
+
+        grid_quant_encoding, grid_quant_configs = self.get_quant_encoding_conf(
+            grid_node, node
+        )
+        grid_dtype = (
+            QNN_TENSOR_TYPE_MAP[grid_tensor.dtype]
+            if grid_quant_encoding
+            == PyQnnWrapper.Qnn_QuantizationEncoding_t.QNN_QUANTIZATION_ENCODING_UNDEFINED
+            else QNN_QUANT_TYPE_MAP[
+                (
+                    torch.uint16
+                    if grid_quant_configs[QCOM_DTYPE] == torch.int32
+                    else grid_quant_configs[QCOM_DTYPE]
+                )
+            ]
+        )
+        # transpose
+        permute_output_tensor = grid_tensor.permute(dims=dims_shape_back)
+        transpose_output_tensor_wrapper = self.define_custom_tensor_wrapper(
+            node_name=node.name + "_transpose",
+            tensor_type=PyQnnWrapper.Qnn_TensorType_t.QNN_TENSOR_TYPE_NATIVE,
+            dtype=grid_dtype,
+            quant_encoding=grid_quant_encoding,
+            quant_configs=grid_quant_configs,
+            dims=permute_output_tensor.size(),
+            tensor=permute_output_tensor,
+            is_fake_tensor=True,
+            nodes_to_wrappers=nodes_to_wrappers,
+        )
+
+        permute_order = cast(List[int], dims_shape_back)
+        permute_order_shape = [len(permute_order)]
+        transpose_op = PyQnnWrapper.PyQnnOpWrapper(
+            node.name,
+            QNN_OP_PACKAGE_NAME_QTI_AISW,
+            OpTranspose.op_name,
+        )
+        transpose_op.AddInputTensors([grid_tensor_wrapper])
+        transpose_op.AddOutputTensors([transpose_output_tensor_wrapper])
+        transpose_op.AddTensorParam(
+            OpTranspose.param_perm,
+            PyQnnWrapper.Qnn_DataType_t.QNN_DATATYPE_UINT_32,
+            len(permute_order_shape),
+            permute_order_shape,
+            np.array(permute_order, dtype=np.uint32),
+            True,
+        )
+        grid_sample_op_list.append(transpose_op)
+
+        out_tensor = self.get_tensor(node, node)
+        output_tensor_wrapper = self.define_tensor(
+            node,
+            node,
+            out_tensor,
+            PyQnnWrapper.Qnn_TensorType_t.QNN_TENSOR_TYPE_NATIVE,
+            nodes_to_wrappers,
+        )
+
+        align_corners = node.args[4] if len(node.args) > 4 else False
+        padding_mode = node.args[3] if len(node.args) > 3 else 0
+        interpo_mode = node.args[2] if len(node.args) > 2 else 0
+
+        grid_sample_op = PyQnnWrapper.PyQnnOpWrapper(
+            node.name,
+            QNN_OP_PACKAGE_NAME_QTI_AISW,
+            OpGridSample.op_name,
+        )
+        grid_sample_op.AddInputTensors(
+            [input_tensor_wrapper, transpose_output_tensor_wrapper]
+        )
+        grid_sample_op.AddOutputTensors([output_tensor_wrapper])
+        grid_sample_op.AddScalarParam(
+            OpGridSample.param_align_corners,
+            PyQnnWrapper.Qnn_DataType_t.QNN_DATATYPE_BOOL_8,
+            {QCOM_DATA: align_corners},
+        )
+        grid_sample_op.AddScalarParam(
+            OpGridSample.param_mode,
+            PyQnnWrapper.Qnn_DataType_t.QNN_DATATYPE_UINT_32,
+            {QCOM_DATA: np.uint32(interpo_mode)},
+        )
+        grid_sample_op.AddScalarParam(
+            OpGridSample.param_padding_mode,
+            PyQnnWrapper.Qnn_DataType_t.QNN_DATATYPE_UINT_32,
+            {QCOM_DATA: np.uint32(padding_mode)},
+        )
+        grid_sample_op_list.append(grid_sample_op)
+        return grid_sample_op_list
@@ -304,6 +304,24 @@ class OpGather:
     param_axis: str = "axis"
 
 
+class OpGridSample:
+    op_name: str = "GridSample"
+    param_align_corners: str = "align_corners"
+    param_mode: str = "mode"
+    param_padding_mode: str = "padding_mode"
+
+    @unique
+    class Mode(IntEnum):
+        BILINAR = 0
+        NEAREST = 1
+
+    @unique
+    class PaddingMode(IntEnum):
+        ZEROS = 0
+        BORDER = 1
+        REFLECTION = 2
+
+
 @dataclass(init=False, frozen=True)
 class OpGatherElements:
     op_name: str = "GatherElements"