fix for staying under openai limits (#2041)

shanbady · web-flow · commit 1a00ac6ea3f2 · 2025-02-12T14:09:36.000-05:00
diff --git a/vector_search/utils.py b/vector_search/utils.py
@@ -262,7 +262,19 @@ def _process_content_embeddings(serialized_content):
             )
             for md in split_metadatas
         ]
-        split_embeddings = list(encoder.embed_documents(split_texts))
+        split_embeddings = []
+        """
+        Break up requests according to chunk size to stay under openai limits
+        600,000 tokens per request
+        max array size: 2048
+        see: https://platform.openai.com/docs/guides/rate-limits
+        """
+        request_chunk_size = int(
+            600000 / settings.CONTENT_FILE_EMBEDDING_CHUNK_SIZE_OVERRIDE
+        )
+        for i in range(0, len(split_texts), request_chunk_size):
+            split_chunk = split_texts[i : i + request_chunk_size]
+            split_embeddings.extend(list(encoder.embed_documents(split_chunk)))
         if len(split_embeddings) > 0:
             resource_points.append(
                 models.PointVectors(