chat-d32-demo

Running on Zero

burtenshaw HF Staff commited on 12 days ago

Commit

8f42a5a

verified ·

1 Parent(s): 9a8c7e2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -23,16 +23,23 @@ tokenizer, model = load_model()
 @spaces.GPU
 def generate(prompt, history):
-    conversation = [
         {"role": "user", "content": prompt},
     ]
     inputs = tokenizer.apply_chat_template(
-        conversation,
         add_generation_prompt=True,
         tokenize=True,
         return_tensors="pt",
-        return_dict=True
     ).to(device)
     with torch.no_grad():
@@ -42,7 +49,9 @@ def generate(prompt, history):
         )
     generated_tokens = outputs[0, inputs.input_ids.shape[1]:]
-    return tokenizer.decode(generated_tokens, skip_special_tokens=True)
 demo = gr.ChatInterface(fn=generate, type="messages", examples=["hello", "hola", "merhaba"], title="NanoChat")

 @spaces.GPU
 def generate(prompt, history):
+    if len(history) > 0:
+        messages = history + [
         {"role": "user", "content": prompt},
     ]
+    else:
+        messages = [
+            {"role": "user", "content": prompt},
+        ]
+    print(history)
     inputs = tokenizer.apply_chat_template(
+        messages,
         add_generation_prompt=True,
         tokenize=True,
         return_tensors="pt",
+        return_dict=True,
     ).to(device)
     with torch.no_grad():
         )
     generated_tokens = outputs[0, inputs.input_ids.shape[1]:]
+    output = tokenizer.decode(generated_tokens, skip_special_tokens=True)
+    return output
 demo = gr.ChatInterface(fn=generate, type="messages", examples=["hello", "hola", "merhaba"], title="NanoChat")