Spaces:

akhaliq
/

Janus-4o-7B

Paused

akhaliq HF Staff commited on Jun 26, 2025

Commit

c6b73f1

verified ·

1 Parent(s): 7bf9267

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -52,21 +52,13 @@ def text_to_image_generate(input_prompt, output_path, vl_chat_processor, vl_gpt,
     for i in range(image_token_num):
         if i == 0:
             outputs = vl_gpt.language_model.model(inputs_embeds=inputs_embeds, use_cache=True)
-            past_key_values = outputs.past_key_values
         else:
-            # 🧠 SAFE DETACH TRICK
-            with torch.no_grad():
-                past_key_values = tuple(
-                    tuple(pkv.detach() for pkv in layer)
-                    for layer in past_key_values
-                )
             outputs = vl_gpt.language_model.model(
                 inputs_embeds=img_embeds.unsqueeze(1),
                 use_cache=True,
                 past_key_values=past_key_values
             )
-            past_key_values = outputs.past_key_values
         hidden_states = outputs.last_hidden_state
         logits = vl_gpt.gen_head(hidden_states[:, -1, :])

     for i in range(image_token_num):
         if i == 0:
             outputs = vl_gpt.language_model.model(inputs_embeds=inputs_embeds, use_cache=True)
         else:
             outputs = vl_gpt.language_model.model(
                 inputs_embeds=img_embeds.unsqueeze(1),
                 use_cache=True,
                 past_key_values=past_key_values
             )
+        past_key_values = outputs.past_key_values
         hidden_states = outputs.last_hidden_state
         logits = vl_gpt.gen_head(hidden_states[:, -1, :])