fix: pytorch init failures (#175)

nicoloboschi · web-flow · commit 0284595909ac · 2026-01-19T15:02:20.000+01:00
diff --git a/hindsight-api/hindsight_api/engine/cross_encoder.py b/hindsight-api/hindsight_api/engine/cross_encoder.py
@@ -136,7 +136,12 @@ async def initialize(self) -> None:
         # 3. Data transfer overhead to GPU outweighs compute benefit
         # 4. CPU inference is actually faster for this workload
         logger.info(f"Reranker: initializing local provider with model {self.model_name}")
-        self._model = CrossEncoder(self.model_name)
+        # Disable lazy loading (meta tensors) which causes issues with newer transformers/accelerate.
+        # Setting low_cpu_mem_usage=False and device_map=None ensures tensors are fully materialized.
+        self._model = CrossEncoder(
+            self.model_name,
+            model_kwargs={"low_cpu_mem_usage": False, "device_map": None},
+        )
 
         # Initialize shared executor (limited workers naturally limits concurrency)
         if LocalSTCrossEncoder._executor is None: