Spaces:

GIZ
/

audit_assistant

Running on T4

ppsingh commited on Aug 6, 2024

Commit

5930e3b

verified ·

1 Parent(s): 1c586ef

Update auditqa/doc_process.py

Files changed (1) hide show

auditqa/doc_process.py CHANGED Viewed

@@ -6,6 +6,7 @@ from torch import cuda
 from langchain_community.document_loaders import PyMuPDFLoader
 from langchain_community.embeddings import HuggingFaceEmbeddings, HuggingFaceInferenceAPIEmbeddings
 from langchain_community.vectorstores import Qdrant
 from auditqa.reports import files, report_list
 device = 'cuda' if cuda.is_available() else 'cpu'
@@ -91,4 +92,16 @@ def process_pdf():
     print("done")
     return qdrant_collections

 from langchain_community.document_loaders import PyMuPDFLoader
 from langchain_community.embeddings import HuggingFaceEmbeddings, HuggingFaceInferenceAPIEmbeddings
 from langchain_community.vectorstores import Qdrant
+from qdrant_client import QdrantClient
 from auditqa.reports import files, report_list
 device = 'cuda' if cuda.is_available() else 'cpu'
     print("done")
     return qdrant_collections
+def get_local_qdrant(name):
+    client = QdrantClient(path=f"./data/{name}")
+    embeddings = HuggingFaceEmbeddings(
+        model_kwargs = {'device': device},
+        encode_kwargs = {'normalize_embeddings': True},
+        model_name="BAAI/bge-small-en-v1.5")
+    vectorstore = Qdrant(client=client, collection_name=name, embeddings=embeddings, )
+    return vectorstore