brandonbeiler
/

InternVL3_5-30B-A3B-FP8-Dynamic

Image-Text-to-Text

compressed-tensors

Model card Files Files and versions

brandonbeiler commited on Aug 28, 2025

Commit

d017b43

·

verified ·

1 Parent(s): 2b58569

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -41,7 +41,7 @@ You can serve the model using vLLM's OpenAI-compatible API server.
 vllm serve brandonbeiler/InternVL3_5-30B-A3B-FP8-Dynamic \
     --quantization compressed-tensors \
     --served-model-name internvl3_5-30B \
-    --reasoning-parser: qwen3 \
     --trust-remote-code \
     --max-model-len 32768 \
     --tensor-parallel-size 1 # Adjust based on your GPU setup

 vllm serve brandonbeiler/InternVL3_5-30B-A3B-FP8-Dynamic \
     --quantization compressed-tensors \
     --served-model-name internvl3_5-30B \
+    --reasoning-parser qwen3 \
     --trust-remote-code \
     --max-model-len 32768 \
     --tensor-parallel-size 1 # Adjust based on your GPU setup