raise exception and log error

GandalfTea · GandalfTea · commit a3570b7abfb7 · 2025-11-30T12:27:13.000-08:00
diff --git a/src/dnet/shard/runtime.py b/src/dnet/shard/runtime.py
@@ -206,17 +206,18 @@ def load_model_core(self, req: ShardLoadModelRequest) -> None:
                 model_metadata=self.model_metadata,
             )
             if is_quant and not applied:
-                logger.warning(
-                    "Failed to quantize what appears to be a quantized model."
-                )
+                raise RuntimeError("apply_quantization_from_config failed.")
             logger.info(
                 "[QUANT] runtime=%s applied=%s model=%s",
                 self.shard_id,
                 applied,
                 self.model_metadata.model_type,
             )
         except RuntimeError as e:
-            logger.warning("[QUANT] apply failed: %s", e)
+            logger.error(
+                f"[QUANT] Failed to quantize what appears to be a quantized model: {e}"
+            )
+            raise
 
         self.model.eval()
         self.cache = make_cache(