pytorch
diff --git a/‎test/quantization/pt2e/test_duplicate_dq.py
+2-2 b/‎test/quantization/pt2e/test_duplicate_dq.py
+2-2
diff --git a/‎test/quantization/pt2e/test_metadata_porting.py
+2-2 b/‎test/quantization/pt2e/test_metadata_porting.py
+2-2
diff --git a/‎test/quantization/pt2e/test_numeric_debugger.py
+1-1 b/‎test/quantization/pt2e/test_numeric_debugger.py
+1-1
diff --git a/‎test/quantization/pt2e/test_quantize_pt2e.py
+36-2 b/‎test/quantization/pt2e/test_quantize_pt2e.py
+36-2
diff --git a/‎test/quantization/pt2e/test_quantize_pt2e_qat.py
+1-1 b/‎test/quantization/pt2e/test_quantize_pt2e_qat.py
+1-1
diff --git a/‎test/quantization/pt2e/test_representation.py
+1-1 b/‎test/quantization/pt2e/test_representation.py
+1-1
@@ -26,10 +26,10 @@
     Quantizer,
     SharedQuantizationSpec,
 )
-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer import (
+from torchao.testing.pt2e._xnnpack_quantizer import (
     get_symmetric_quantization_config,
 )
-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer_utils import (
+from torchao.testing.pt2e._xnnpack_quantizer_utils import (
     OP_TO_ANNOTATOR,
     QuantizationConfig,
 )
 
@@ -16,10 +16,10 @@
 
 from torchao.quantization.pt2e.quantize_pt2e import convert_pt2e, prepare_pt2e
 from torchao.quantization.pt2e.quantizer import QuantizationAnnotation, Quantizer
-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer import (
+from torchao.testing.pt2e._xnnpack_quantizer import (
     get_symmetric_quantization_config,
 )
-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer_utils import OP_TO_ANNOTATOR
+from torchao.testing.pt2e._xnnpack_quantizer_utils import OP_TO_ANNOTATOR
 from torchao.utils import TORCH_VERSION_AT_LEAST_2_7
 
 
 
@@ -24,7 +24,7 @@
 )
 from torchao.quantization.pt2e.graph_utils import bfs_trace_with_node_process
 from torchao.quantization.pt2e.quantize_pt2e import convert_pt2e, prepare_pt2e
-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer import (
+from torchao.testing.pt2e._xnnpack_quantizer import (
     XNNPACKQuantizer,
     get_symmetric_quantization_config,
 )
 
@@ -57,11 +57,11 @@
 from torchao.quantization.pt2e.quantizer.embedding_quantizer import (  # noqa: F811
     EmbeddingQuantizer,
 )
-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer import (
+from torchao.testing.pt2e._xnnpack_quantizer import (
     XNNPACKQuantizer,
     get_symmetric_quantization_config,
 )
-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer_utils import (
+from torchao.testing.pt2e._xnnpack_quantizer_utils import (
     OP_TO_ANNOTATOR,
     QuantizationConfig,
 )
@@ -1328,6 +1328,40 @@ def validate(self, model: torch.fx.GraphModule) -> None:
         with self.assertRaises(Exception):
             m = prepare_pt2e(m, BackendAQuantizer())
 
+    def _quantize(self, m, quantizer, example_inputs, is_qat: bool = False):
+        # resetting dynamo cache
+        torch._dynamo.reset()
+
+        m = export_for_training(
+            m,
+            example_inputs,
+        ).module()
+        if is_qat:
+            m = prepare_qat_pt2e(m, quantizer)
+        else:
+            m = prepare_pt2e(m, quantizer)
+        m(*example_inputs)
+        m = convert_pt2e(m)
+        return m
+
+    def _get_pt2e_quantized_linear(self, is_per_channel=False) -> torch.fx.GraphModule:
+        class M(torch.nn.Module):
+            def __init__(self) -> None:
+                super().__init__()
+                self.linear = torch.nn.Linear(2, 2)
+
+            def forward(self, x):
+                return self.linear(x)
+
+        quantizer = XNNPACKQuantizer()
+        operator_config = get_symmetric_quantization_config(
+            is_per_channel=is_per_channel
+        )
+        quantizer.set_global(operator_config)
+        example_inputs = (torch.randn(2, 2),)
+        m = M().eval()
+        return self._quantize(m, quantizer, example_inputs)
+
     def test_fold_quantize(self):
         """Test to make sure the quantized model gets quantized weight (quantize_per_tensor op is folded)"""
         m = self._get_pt2e_quantized_linear()
 
@@ -47,7 +47,7 @@
     QuantizationSpec,
     Quantizer,
 )
-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer import (
+from torchao.testing.pt2e._xnnpack_quantizer import (
     XNNPACKQuantizer,
     get_symmetric_quantization_config,
 )
 
@@ -23,7 +23,7 @@
 
 from torchao.quantization.pt2e.quantize_pt2e import convert_pt2e, prepare_pt2e
 from torchao.quantization.pt2e.quantizer import Quantizer
-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer import (
+from torchao.testing.pt2e._xnnpack_quantizer import (
     XNNPACKQuantizer,
     get_symmetric_quantization_config,
 )
Original file line number	Diff line number	Diff line change
`@@ -26,10 +26,10 @@`
`26`	`26`	`Quantizer,`
`27`	`27`	`SharedQuantizationSpec,`
`28`	`28`	`)`
`29`		`-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer import (`
	`29`	`+from torchao.testing.pt2e._xnnpack_quantizer import (`
`30`	`30`	`get_symmetric_quantization_config,`
`31`	`31`	`)`
`32`		`-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer_utils import (`
	`32`	`+from torchao.testing.pt2e._xnnpack_quantizer_utils import (`
`33`	`33`	`OP_TO_ANNOTATOR,`
`34`	`34`	`QuantizationConfig,`
`35`	`35`	`)`
Original file line number	Diff line number	Diff line change
`@@ -24,7 +24,7 @@`
`24`	`24`	`)`
`25`	`25`	`from torchao.quantization.pt2e.graph_utils import bfs_trace_with_node_process`
`26`	`26`	`from torchao.quantization.pt2e.quantize_pt2e import convert_pt2e, prepare_pt2e`
`27`		`-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer import (`
	`27`	`+from torchao.testing.pt2e._xnnpack_quantizer import (`
`28`	`28`	`XNNPACKQuantizer,`
`29`	`29`	`get_symmetric_quantization_config,`
`30`	`30`	`)`
Original file line number	Diff line number	Diff line change
`@@ -47,7 +47,7 @@`
`47`	`47`	`QuantizationSpec,`
`48`	`48`	`Quantizer,`
`49`	`49`	`)`
`50`		`-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer import (`
	`50`	`+from torchao.testing.pt2e._xnnpack_quantizer import (`
`51`	`51`	`XNNPACKQuantizer,`
`52`	`52`	`get_symmetric_quantization_config,`
`53`	`53`	`)`
Original file line number	Diff line number	Diff line change
`@@ -23,7 +23,7 @@`
`23`	`23`
`24`	`24`	`from torchao.quantization.pt2e.quantize_pt2e import convert_pt2e, prepare_pt2e`
`25`	`25`	`from torchao.quantization.pt2e.quantizer import Quantizer`
`26`		`-from torchao.quantization.pt2e.quantizer.xnnpack_quantizer import (`
	`26`	`+from torchao.testing.pt2e._xnnpack_quantizer import (`
`27`	`27`	`XNNPACKQuantizer,`
`28`	`28`	`get_symmetric_quantization_config,`
`29`	`29`	`)`