brandonbeiler
/

InternVL3_5-38B-FP8-Dynamic

Image-Text-to-Text

compressed-tensors

Model card Files Files and versions

brandonbeiler commited on Aug 28, 2025

Commit

bc94e29

·

verified ·

1 Parent(s): efcfd92

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -30,7 +30,7 @@ You can serve the model using vLLM's OpenAI-compatible API server.
 vllm serve brandonbeiler/InternVL3_5-38B-FP8-Dynamic \
     --quantization compressed-tensors \
     --served-model-name internvl3_5-38b \
-    --reasoning-parser: qwen3 \
     --trust-remote-code \
     --max-model-len 32768 \
     --tensor-parallel-size 1 # Adjust based on your GPU setup

 vllm serve brandonbeiler/InternVL3_5-38B-FP8-Dynamic \
     --quantization compressed-tensors \
     --served-model-name internvl3_5-38b \
+    --reasoning-parser qwen3 \
     --trust-remote-code \
     --max-model-len 32768 \
     --tensor-parallel-size 1 # Adjust based on your GPU setup