Spaces:

MCP-1st-Birthday
/

Vault.MCP

Running

App Files Files Community

bigwolfe commited on 17 days ago

Commit

c449c99

1 Parent(s): f820354

bugs

Browse files

Files changed (3) hide show

backend/src/services/rag_index.py +60 -16
backend/tests/unit/test_rag_service.py +5 -5
frontend/src/components/ChatPanel.tsx +6 -4

backend/src/services/rag_index.py CHANGED Viewed

@@ -2,9 +2,13 @@
 import logging
 import os
 from pathlib import Path
 from typing import Optional, List
 from llama_index.core import (
     VectorStoreIndex,
     SimpleDirectoryReader,
@@ -14,6 +18,7 @@ from llama_index.core import (
     Settings
 )
 try:
     from llama_index.llms.google_genai import Gemini
     from llama_index.embeddings.google_genai import GeminiEmbedding
@@ -29,15 +34,29 @@ from .config import get_config
 from .vault import VaultService
 from ..models.rag import ChatMessage, ChatResponse, SourceReference, StatusResponse
-logger = logging.getLogger(__name__)
 class RAGIndexService:
     """Service for managing LlamaIndex vector stores."""
     def __init__(self):
         self.vault_service = VaultService()
         self.config = get_config()
         self._setup_gemini()
     def _setup_gemini(self):
         """Configure global LlamaIndex settings for Gemini."""
@@ -71,17 +90,18 @@ class RAGIndexService:
     def get_or_build_index(self, user_id: str) -> VectorStoreIndex:
         """Load existing index or build a new one from vault notes."""
-        persist_dir = self.get_persist_dir(user_id)
-        # check if index files exist (docstore.json, index_store.json etc)
-        try:
-            storage_context = StorageContext.from_defaults(persist_dir=persist_dir)
-            index = load_index_from_storage(storage_context)
-            logger.info(f"Loaded existing index for user {user_id}")
-            return index
-        except Exception:
-            logger.info(f"No valid index found for {user_id}, building new one...")
-            return self.build_index(user_id)
     def build_index(self, user_id: str) -> VectorStoreIndex:
         """Build a new index from the user's vault."""
@@ -90,6 +110,15 @@ class RAGIndexService:
         # Read notes from VaultService
         notes = self.vault_service.list_notes(user_id)
         documents = []
         for note_summary in notes:
@@ -131,10 +160,25 @@ class RAGIndexService:
         persist_dir = self.get_persist_dir(user_id)
         doc_store_path = os.path.join(persist_dir, "docstore.json")
-        if os.path.exists(doc_store_path):
-            return StatusResponse(status="ready", doc_count=0, last_updated=None)
-        return StatusResponse(status="building", doc_count=0, last_updated=None)
     def chat(self, user_id: str, messages: List[ChatMessage]) -> ChatResponse:
         """Run RAG chat query with history."""

 import logging
 import os
+import threading
 from pathlib import Path
 from typing import Optional, List
+# Configure logger first so it can be used in try/except
+logger = logging.getLogger(__name__)
 from llama_index.core import (
     VectorStoreIndex,
     SimpleDirectoryReader,
     Settings
 )
+# Try to import Gemini, handle missing dependency gracefully
 try:
     from llama_index.llms.google_genai import Gemini
     from llama_index.embeddings.google_genai import GeminiEmbedding
 from .vault import VaultService
 from ..models.rag import ChatMessage, ChatResponse, SourceReference, StatusResponse
 class RAGIndexService:
     """Service for managing LlamaIndex vector stores."""
+    _instance = None
+    _lock = threading.Lock()
+    def __new__(cls):
+        if cls._instance is None:
+            with cls._lock:
+                if cls._instance is None:
+                    cls._instance = super(RAGIndexService, cls).__new__(cls)
+                    cls._instance._initialized = False
+        return cls._instance
     def __init__(self):
+        if getattr(self, "_initialized", False):
+            return
         self.vault_service = VaultService()
         self.config = get_config()
+        self._index_lock = threading.Lock() # Per-instance lock for index ops
         self._setup_gemini()
+        self._initialized = True
     def _setup_gemini(self):
         """Configure global LlamaIndex settings for Gemini."""
     def get_or_build_index(self, user_id: str) -> VectorStoreIndex:
         """Load existing index or build a new one from vault notes."""
+        with self._index_lock:
+            persist_dir = self.get_persist_dir(user_id)
+            # check if index files exist (docstore.json, index_store.json etc)
+            try:
+                storage_context = StorageContext.from_defaults(persist_dir=persist_dir)
+                index = load_index_from_storage(storage_context)
+                logger.info(f"Loaded existing index for user {user_id}")
+                return index
+            except Exception:
+                logger.info(f"No valid index found for {user_id}, building new one...")
+                return self.build_index(user_id)
     def build_index(self, user_id: str) -> VectorStoreIndex:
         """Build a new index from the user's vault."""
         # Read notes from VaultService
         notes = self.vault_service.list_notes(user_id)
+        if not notes:
+            # Handle empty vault (Fix #8)
+            logger.info(f"No notes found for {user_id}, creating empty index")
+            index = VectorStoreIndex.from_documents([])
+            # Persist empty index to avoid rebuilding every time?
+            # LlamaIndex might not persist empty index well.
+            # Let's just return it.
+            return index
         documents = []
         for note_summary in notes:
         persist_dir = self.get_persist_dir(user_id)
         doc_store_path = os.path.join(persist_dir, "docstore.json")
+        doc_count = 0
+        status = "building"
+        if os.path.exists(doc_store_path):
+            status = "ready"
+            try:
+                # Simple line count or file size check to avoid loading whole JSON
+                # Actually, docstore.json is a dict.
+                # Let's just load it if it's small, or stat it.
+                # For MVP, just checking existence is "ready".
+                # To get count, we can try loading keys.
+                import json
+                with open(doc_store_path, 'r') as f:
+                    data = json.load(f)
+                    doc_count = len(data.get("docstore/data", {}))
+            except Exception:
+                logger.warning(f"Failed to read docstore for status: {doc_store_path}")
+        return StatusResponse(status=status, doc_count=doc_count, last_updated=None)
     def chat(self, user_id: str, messages: List[ChatMessage]) -> ChatResponse:
         """Run RAG chat query with history."""

backend/tests/unit/test_rag_service.py CHANGED Viewed

@@ -82,10 +82,10 @@ def test_get_status(mock_exists, rag_service):
 def test_chat(mock_storage, mock_load, rag_service):
     user_id = "test-user"
-    # Mock Index and QueryEngine
     mock_index = MagicMock()
-    mock_query_engine = MagicMock()
-    mock_index.as_query_engine.return_value = mock_query_engine
     mock_load.return_value = mock_index
     # Mock Response
@@ -99,7 +99,7 @@ def test_chat(mock_storage, mock_load, rag_service):
     mock_node.score = 0.9
     mock_response.source_nodes = [mock_node]
-    mock_query_engine.query.return_value = mock_response
     from backend.src.models.rag import ChatMessage
     messages = [ChatMessage(role="user", content="Question")]
@@ -109,4 +109,4 @@ def test_chat(mock_storage, mock_load, rag_service):
     assert response.answer == "AI Answer"
     assert len(response.sources) == 1
     assert response.sources[0].path == "note.md"
-    mock_query_engine.query.assert_called_with("Question")

 def test_chat(mock_storage, mock_load, rag_service):
     user_id = "test-user"
+    # Mock Index and ChatEngine
     mock_index = MagicMock()
+    mock_chat_engine = MagicMock()
+    mock_index.as_chat_engine.return_value = mock_chat_engine
     mock_load.return_value = mock_index
     # Mock Response
     mock_node.score = 0.9
     mock_response.source_nodes = [mock_node]
+    mock_chat_engine.chat.return_value = mock_response
     from backend.src.models.rag import ChatMessage
     messages = [ChatMessage(role="user", content="Question")]
     assert response.answer == "AI Answer"
     assert len(response.sources) == 1
     assert response.sources[0].path == "note.md"
+    mock_chat_engine.chat.assert_called()

frontend/src/components/ChatPanel.tsx CHANGED Viewed

@@ -34,14 +34,16 @@ export function ChatPanel({ onNavigateToNote }: ChatPanelProps) {
       timestamp: new Date().toISOString()
     };
-    setMessages(prev => [...prev, userMsg]);
     setInput('');
     setIsLoading(true);
     try {
-      // Create request with full history (US3 prep)
-      const history = [...messages, userMsg];
-      const response = await sendChat({ messages: history });
       const assistantMsg: ChatMessageType = {
         role: 'assistant',

       timestamp: new Date().toISOString()
     };
+    // Construct new history immediately
+    const newHistory = [...messages, userMsg];
+    // Optimistically update UI
+    setMessages(newHistory);
     setInput('');
     setIsLoading(true);
     try {
+      const response = await sendChat({ messages: newHistory });
       const assistantMsg: ChatMessageType = {
         role: 'assistant',