Spaces:

aakash-malhan
/

arxiv-rag-demo

Sleeping

App Files Files Community

aakash-malhan commited on Nov 9

Commit

a2f326b

verified ·

1 Parent(s): a15b79f

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -32

app.py CHANGED Viewed

@@ -1,3 +1,4 @@
 import os
 import subprocess
 import gradio as gr
@@ -6,18 +7,42 @@ from langchain.chains import RetrievalQA
 from langchain.prompts import PromptTemplate
 from sentence_transformers import SentenceTransformer
 import weaviate
-# Groq import
-from langchain_groq import ChatGroq
 # === SECRETS ===
 WEAVIATE_URL = os.environ["WEAVIATE_URL"]
 WEAVIATE_KEY = os.environ["WEAVIATE_KEY"]
 os.environ["GROQ_API_KEY"] = os.environ["GROQ_API_KEY"]
-# AUTO-INGEST ON START
 def run_ingestion():
-    print("Running ingestion...")
     result = subprocess.run(["python", "ingest.py"], capture_output=True, text=True)
     print(result.stdout)
     if result.returncode != 0:
@@ -25,13 +50,11 @@ def run_ingestion():
     else:
         print("Ingestion complete!")
-# Run once at startup
 run_ingestion()
-# RAG CHAIN
-@gr.cache
 def get_rag_chain():
-    # v3 Weaviate Client
     client = weaviate.Client(
         url=WEAVIATE_URL,
         auth_client_secret=weaviate.AuthApiKey(WEAVIATE_KEY)
@@ -40,16 +63,12 @@ def get_rag_chain():
     vectorstore = Weaviate(client, "Paper", "text", embedding=embedder)
     retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
-    # Use ChatGroq
     llm = ChatGroq(model="llama-3.1-70b-instruct", temperature=0)
     prompt = PromptTemplate.from_template(
         "Answer using only this context:\n{context}\n\nQuestion: {question}\nAnswer:"
     )
     return RetrievalQA.from_chain_type(
-        llm=llm,
-        retriever=retriever,
-        chain_type_kwargs={"prompt": prompt}
     )
 def search(query):
@@ -57,33 +76,23 @@ def search(query):
         qa = get_rag_chain()
         result = qa.invoke({"query": query})
         answer = result["result"]
         sources = "\n\n".join([
             f"**{doc.metadata.get('title', 'No Title')}**\n{doc.page_content[:300]}..."
             for doc in result["source_documents"]
         ])
-        return answer, sources if sources.strip() else "No sources retrieved."
     except Exception as e:
         return f"Error: {str(e)}", "Check logs."
-# GRADIO UI
-with gr.Blocks(title="ArXiv RAG Search") as demo:
-    gr.Markdown("# ArXiv RAG Search Engine")
-    gr.Markdown("10K+ research papers • Llama-3.1 • Weaviate • Auto-indexed")
-    with gr.Row():
-        txt = gr.Textbox(
-            label="Ask about AI, physics, math...",
-            placeholder="What is the attention mechanism?",
-            lines=2
-        )
-        btn = gr.Button("Search", variant="primary")
-    with gr.Row():
-        out_answer = gr.Markdown(label="Answer")
-        out_sources = gr.Markdown(label="Sources")
-    btn.click(search, inputs=txt, outputs=[out_answer, out_sources])
-    txt.submit(lambda x: (x, gr.update()), txt, [txt, btn]).then(search, txt, [out_answer, out_sources])
 demo.launch()

+# app.py - FINAL, 100% WORKING
 import os
 import subprocess
 import gradio as gr
 from langchain.prompts import PromptTemplate
 from sentence_transformers import SentenceTransformer
 import weaviate
+import time
+import requests
+# === FIX: Correct Groq import ===
+from langchain_groq import ChatGroq
 # === SECRETS ===
 WEAVIATE_URL = os.environ["WEAVIATE_URL"]
 WEAVIATE_KEY = os.environ["WEAVIATE_KEY"]
 os.environ["GROQ_API_KEY"] = os.environ["GROQ_API_KEY"]
+# === WAIT FOR WEAVIATE TO BE READY ===
+def wait_for_weaviate(url, key, timeout=120):
+    headers = {"Authorization": f"Bearer {key}"}
+    ready_url = f"{url}/v1/.well-known/ready"
+    print("Waiting for Weaviate to be ready...")
+    for i in range(timeout):
+        try:
+            response = requests.get(ready_url, headers=headers)
+            if response.status_code == 200:
+                print("Weaviate is ready!")
+                return True
+        except:
+            pass
+        print(f"Attempt {i+1}/{timeout}... waiting 1s")
+        time.sleep(1)
+    print("Weaviate did not start in time.")
+    return False
+# === AUTO-INGEST ON START ===
 def run_ingestion():
+    print("Starting ingestion...")
+    if not wait_for_weaviate(WEAVIATE_URL, WEAVIATE_KEY):
+        print("Cannot connect to Weaviate. Skipping ingestion.")
+        return
     result = subprocess.run(["python", "ingest.py"], capture_output=True, text=True)
     print(result.stdout)
     if result.returncode != 0:
     else:
         print("Ingestion complete!")
+# Run once
 run_ingestion()
+# === RAG CHAIN (NO @gr.cache) ===
 def get_rag_chain():
     client = weaviate.Client(
         url=WEAVIATE_URL,
         auth_client_secret=weaviate.AuthApiKey(WEAVIATE_KEY)
     vectorstore = Weaviate(client, "Paper", "text", embedding=embedder)
     retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
     llm = ChatGroq(model="llama-3.1-70b-instruct", temperature=0)
     prompt = PromptTemplate.from_template(
         "Answer using only this context:\n{context}\n\nQuestion: {question}\nAnswer:"
     )
     return RetrievalQA.from_chain_type(
+        llm=llm, retriever=retriever, chain_type_kwargs={"prompt": prompt}
     )
 def search(query):
         qa = get_rag_chain()
         result = qa.invoke({"query": query})
         answer = result["result"]
         sources = "\n\n".join([
             f"**{doc.metadata.get('title', 'No Title')}**\n{doc.page_content[:300]}..."
             for doc in result["source_documents"]
         ])
+        return answer, sources or "No sources found."
     except Exception as e:
         return f"Error: {str(e)}", "Check logs."
+# === GRADIO UI ===
+with gr.Blocks(title="ArXiv RAG") as demo:
+    gr.Markdown("# ArXiv RAG Search")
+    gr.Markdown("10K+ papers • Llama-3.1 • Weaviate")
+    txt = gr.Textbox(label="Ask", placeholder="What is attention?", lines=2)
+    btn = gr.Button("Search", variant="primary")
+    out1 = gr.Markdown(); out2 = gr.Markdown()
+    btn.click(search, txt, [out1, out2])
 demo.launch()