Spaces:

aakash-malhan
/

arxiv-rag-demo

Sleeping

App Files Files Community

aakash-malhan commited on Nov 9

Commit

b3b881b

verified ·

1 Parent(s): 872925a

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -17

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
-# app.py - Gradio app for HF Spaces
 import gradio as gr
 from langchain_community.vectorstores import Weaviate
 from langchain_community.llms import Groq
@@ -6,12 +7,21 @@ from langchain.chains import RetrievalQA
 from langchain.prompts import PromptTemplate
 from sentence_transformers import SentenceTransformer
 import weaviate
-import os
 WEAVIATE_URL = os.environ["WEAVIATE_URL"]
 WEAVIATE_KEY = os.environ["WEAVIATE_KEY"]
 os.environ["GROQ_API_KEY"] = os.environ["GROQ_API_KEY"]
 @gr.cache
 def get_rag_chain():
     client = weaviate.Client(url=WEAVIATE_URL, auth_client_secret=weaviate.AuthApiKey(WEAVIATE_KEY))
@@ -30,28 +40,20 @@ def search(query):
         qa = get_rag_chain()
         result = qa.invoke({"query": query})
         answer = result["result"]
         sources = "\n\n".join([
             f"**{doc.metadata['title']}**\n{doc.page_content[:300]}..."
             for doc in result["source_documents"]
         ])
         return answer, sources
     except Exception as e:
-        return f"Error: {str(e)}", "Check logs."
 # UI
-with gr.Blocks(title="ArXiv RAG Search") as demo:
-    gr.Markdown("# ArXiv RAG Search Engine")
-    gr.Markdown("10K+ research papers • Llama-3.1 • Weaviate • Free Demo")
-    txt = gr.Textbox(label="Ask anything", placeholder="What is the attention mechanism?", lines=2)
-    btn = gr.Button("Search", variant="primary")
-    with gr.Row():
-        out1 = gr.Markdown(label="Answer")
-        out2 = gr.Markdown(label="Sources")
-    btn.click(search, inputs=txt, outputs=[out1, out2])
-    txt.submit(btn)
 demo.launch()

+import os
+import subprocess
 import gradio as gr
 from langchain_community.vectorstores import Weaviate
 from langchain_community.llms import Groq
 from langchain.prompts import PromptTemplate
 from sentence_transformers import SentenceTransformer
 import weaviate
+# SECRETS
 WEAVIATE_URL = os.environ["WEAVIATE_URL"]
 WEAVIATE_KEY = os.environ["WEAVIATE_KEY"]
 os.environ["GROQ_API_KEY"] = os.environ["GROQ_API_KEY"]
+# AUTO-INGEST ON START
+def run_ingestion():
+    print("Running ingestion...")
+    subprocess.run(["python", "ingest.py"], check=True)
+    print("Ingestion complete!")
+run_ingestion()
+# RAG CHAIN
 @gr.cache
 def get_rag_chain():
     client = weaviate.Client(url=WEAVIATE_URL, auth_client_secret=weaviate.AuthApiKey(WEAVIATE_KEY))
         qa = get_rag_chain()
         result = qa.invoke({"query": query})
         answer = result["result"]
         sources = "\n\n".join([
             f"**{doc.metadata['title']}**\n{doc.page_content[:300]}..."
             for doc in result["source_documents"]
         ])
         return answer, sources
     except Exception as e:
+        return f"Error: {str(e)}", ""
 # UI
+with gr.Blocks() as demo:
+    gr.Markdown("# ArXiv RAG Search")
+    txt = gr.Textbox(label="Ask", placeholder="What is attention?")
+    btn = gr.Button("Search")
+    out1 = gr.Markdown(); out2 = gr.Markdown()
+    btn.click(search, txt, [out1, out2])
 demo.launch()