Qwen
/

Qwen3-4B-FP8

Text Generation

text-generation-inference

Model card Files Files and versions

5.21 GB

5 contributors

History: 11 commits

simon-mo's picture

Remove vLLM FP8 Limitation

5bb0cb1 verified 6 months ago