Spaces:

MurtazaKhan101
/

prompt_refiner

Sleeping

App Files Files Community

MurtazaKhan101 commited on Jul 29

Commit

ad364eb

verified ·

1 Parent(s): 482bfe0

Upload 3 files

Browse files

Files changed (3) hide show

Dockerfile +13 -0
app.py +34 -0
requirements.txt +4 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,13 @@

+FROM python:3.9
+RUN useradd -m -u 1000 user
+USER user
+ENV PATH="/home/user/.local/bin:$PATH"
+WORKDIR /app
+COPY --chown=user ./requirements.txt requirements.txt
+RUN pip install --no-cache-dir --upgrade -r requirements.txt
+COPY --chown=user . /app
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

	@@ -0,0 +1,34 @@

+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import torch
+app = FastAPI()
+# Load model and tokenizer
+model_name = "alibaba-pai/Qwen2-1.5B-Instruct-Refine"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name).to("cuda" if torch.cuda.is_available() else "cpu")
+# Define request model
+class UserPrompt(BaseModel):
+    prompt: str
+@app.post("/refine-prompt")
+async def refine_prompt(user_prompt: UserPrompt):
+    if model is None or tokenizer is None:
+        raise HTTPException(status_code=500, detail="Model not loaded.")
+    system_prompt = (
+        "You are a professional prompt refiner. Your task is to take a user's prompt and improve it by correcting "
+        "grammar, spelling, and sentence structure. Enhance fluency, clarity, and natural tone without changing "
+        "the original intent. Add slight descriptive detail only if it improves understanding. Do not over-extend, "
+        "repeat, or remove any important information. Return only the refined prompt, nothing else."
+    )
+    formatted_prompt = f"<|im_start|>system\n{system_prompt}<|im_end|>\n<|im_start|>user\n{user_prompt.prompt}<|im_end|>\n<|im_start|>assistant\n"
+    inputs = tokenizer(formatted_prompt, return_tensors="pt").to(model.device)
+    outputs = model.generate(**inputs, max_new_tokens=40)
+    refined_prompt = tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:], skip_special_tokens=True)
+    return {"refined_prompt": refined_prompt}

requirements.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+fastapi
+uvicorn
+transformers
+torch