Refactor embedding instantiation

pfos · Sep 28, 2023 · c2cf59e · c2cf59e
1 parent 4572231
commit c2cf59e
Show file tree

Hide file tree

Showing 4 changed files with 33 additions and 40 deletions.
diff --git a/bot.py b/bot.py
@@ -5,8 +5,7 @@
 from streamlit.logger import get_logger
 from langchain.callbacks.base import BaseCallbackHandler
 from langchain.vectorstores.neo4j_vector import Neo4jVector
-from langchain.embeddings.openai import OpenAIEmbeddings
-from langchain.embeddings import OllamaEmbeddings, SentenceTransformerEmbeddings
+
 from langchain.chat_models import ChatOpenAI, ChatOllama
 from langchain.chains import RetrievalQAWithSourcesChain
 from langchain.chains.qa_with_sources import load_qa_with_sources_chain
@@ -17,7 +16,7 @@
 )
 from langchain.graphs import Neo4jGraph
 from dotenv import load_dotenv
-from utils import extract_title_and_question
+from utils import extract_title_and_question, load_embedding_model
 
 load_dotenv(".env")
 
@@ -27,12 +26,11 @@
 ollama_base_url = os.getenv("OLLAMA_BASE_URL")
 embedding_model_name = os.getenv("EMBEDDING_MODEL")
 llm_name = os.getenv("LLM")
-
+# Remapping ror Langchain Neo4j integration
 os.environ["NEO4J_URL"] = url
 
 logger = get_logger(__name__)
 
-
 neo4j_graph = Neo4jGraph(url=url, username=username, password=password)
 
 
@@ -59,20 +57,9 @@ def on_llm_new_token(self, token: str, **kwargs) -> None:
         self.container.markdown(self.text)
 
 
-if embedding_model_name == "ollama":
-    embeddings = OllamaEmbeddings(base_url=ollama_base_url, model="llama2")
-    dimension = 4096
-    logger.info("Embedding: Using Ollama")
-elif embedding_model_name == "openai":
-    embeddings = OpenAIEmbeddings()
-    dimension = 1536
-    logger.info("Embedding: Using OpenAI")
-else:
-    embeddings = SentenceTransformerEmbeddings(
-        model_name="all-MiniLM-L6-v2", cache_folder="/embedding_model"
-    )
-    dimension = 384
-    logger.info("Embedding: Using SentenceTransformer")
+embeddings, dimension = load_embedding_model(
+    embedding_model_name, config={ollama_base_url: ollama_base_url}, logger=logger
+)
 
 create_vector_index(dimension)
 

diff --git a/loader.Dockerfile b/loader.Dockerfile
@@ -15,6 +15,7 @@ RUN pip install --upgrade -r requirements.txt
 
 # COPY .env .
 COPY loader.py .
+COPY utils.py .
 
 EXPOSE 8502
 

diff --git a/loader.py b/loader.py
@@ -1,16 +1,10 @@
 import os
 import requests
-
 from dotenv import load_dotenv
-from langchain.embeddings import (
-    OllamaEmbeddings,
-    OpenAIEmbeddings,
-    SentenceTransformerEmbeddings,
-)
 from langchain.graphs import Neo4jGraph
-
 import streamlit as st
 from streamlit.logger import get_logger
+from utils import load_embedding_model
 
 load_dotenv(".env")
 
@@ -24,20 +18,9 @@
 
 logger = get_logger(__name__)
 
-if embedding_model_name == "ollama":
-    embeddings = OllamaEmbeddings(base_url=ollama_base_url, model="llama2")
-    dimension = 4096
-    logger.info("Embedding: Using Ollama")
-elif embedding_model_name == "openai":
-    embeddings = OpenAIEmbeddings()
-    dimension = 1536
-    logger.info("Embedding: Using OpenAI")
-else:
-    embeddings = SentenceTransformerEmbeddings(
-        model_name="all-MiniLM-L6-v2", cache_folder="/embedding_model"
-    )
-    dimension = 384
-    logger.info("Embedding: Using SentenceTransformer")
+embeddings, dimension = load_embedding_model(
+    embedding_model_name, config={ollama_base_url: ollama_base_url}, logger=logger
+)
 
 neo4j_graph = Neo4jGraph(url=url, username=username, password=password)
 

diff --git a/utils.py b/utils.py
@@ -1,3 +1,25 @@
+from langchain.embeddings.openai import OpenAIEmbeddings
+from langchain.embeddings import OllamaEmbeddings, SentenceTransformerEmbeddings
+
+
+def load_embedding_model(embedding_model_name: str, config={}, logger=print):
+    if embedding_model_name == "ollama":
+        embeddings = OllamaEmbeddings(base_url=config.ollama_base_url, model="llama2")
+        dimension = 4096
+        logger.info("Embedding: Using Ollama")
+    elif embedding_model_name == "openai":
+        embeddings = OpenAIEmbeddings()
+        dimension = 1536
+        logger.info("Embedding: Using OpenAI")
+    else:
+        embeddings = SentenceTransformerEmbeddings(
+            model_name="all-MiniLM-L6-v2", cache_folder="/embedding_model"
+        )
+        dimension = 384
+        logger.info("Embedding: Using SentenceTransformer")
+    return embeddings, dimension
+
+
 def extract_title_and_question(input_string):
     lines = input_string.strip().split("\n")