Edit Models filters

Apps

Inference Providers

HF Inference API

Misc

compressed-tensors

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

3,016

Full-text search

Active filters: compressed-tensors

Benasd/Qwen3-VL-30B-A3B-Instruct-NVFP4-FP8-MIXED

19B • Updated 11 days ago • 73

Benasd/Qwen3-VL-30B-A3B-Instruct-NVFP4-BF16-MIXED

19B • Updated 11 days ago • 49

Benasd/Qwen3-VL-30B-A3B-Thinking-NVFP4-FP8-MIXED

19B • Updated 11 days ago • 17

Benasd/Qwen3-VL-30B-A3B-Thinking-NVFP4-BF16-MIXED

19B • Updated 11 days ago • 18

cpatonn/LFM2-8B-A1B-AWQ-8bit

Text Generation • 3B • Updated 11 days ago • 14

ig1/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated 11 days ago • 100

kristaller486/test

17B • Updated 11 days ago • 17

mispeech/midashenglm-7b-1021-w4a16-gptq

Audio-Text-to-Text • 3B • Updated about 2 hours ago • 4

ig1/Qwen2.5-VL-7B-Instruct-NVFP4

Image-Text-to-Text • 5B • Updated 11 days ago • 31

braginpawel/mst-unc-grpo-1-W8A8

22B • Updated 11 days ago • 43

skqliao/Qwen3-30B-A3B-W4A16-G256-GPTQ

13B • Updated 11 days ago • 15

nm-testing/Llama-4-Scout-17B-16E-Instruct-BLOCK-FP8

Text Generation • 109B • Updated 4 days ago • 58

RedHatAI/Llama-3.3-70B-Instruct-FP8-block

Text Generation • 71B • Updated 6 days ago • 22

EvGUT/qm3232_final_fp8

15B • Updated 10 days ago • 35

nm-testing/Llama-3.1-8B-Instruct-KV-FP8-Tensor

8B • Updated 10 days ago • 13

nm-testing/Llama-3.1-8B-Instruct-QKV-FP8-Tensor

8B • Updated 10 days ago • 8

nm-testing/Llama-3.1-8B-Instruct-QKV-FP8-Head

8B • Updated 10 days ago • 11

Sinensis/4.2.0-Broken-Tutu-24b-FP8-Dynamic

24B • Updated 10 days ago • 11

jbgjbg/ExaOne-4.0.1-32B-mxfp8-compressed

33B • Updated about 21 hours ago • 37

jart25/Qwen3-VL-30B-A3B-Instruct-AWQ-8bit-TEST

10B • Updated 10 days ago • 1

Anupam2001/Qwen2.5-3B-Instruct-SmoothQuant-GPTQ-W4A16

1.0B • Updated 10 days ago • 18

cpatonn/Qwen3-VL-32B-Instruct-AWQ-4bit

Image-Text-to-Text • 7B • Updated 9 days ago • 1.2k

cpatonn/Qwen3-VL-32B-Thinking-AWQ-4bit

Image-Text-to-Text • 7B • Updated 9 days ago • 22.2k • 1

xihc-ucb/Meta-Llama-3-8B-vLLM-FP8-Block

Text Generation • 8B • Updated 9 days ago • 11

xihc-ucb/Qwen2.5-7B-vLLM-FP8-Block

Text Generation • 8B • Updated 9 days ago • 1.45k

xihc-ucb/Qwen2.5-7B-vLLM-FP8-Channel

Text Generation • 8B • Updated 9 days ago • 978

vkerkez/GLM-4.6-REAP-266B-A32B-awq-sym

37B • Updated 9 days ago • 121

Amadeus99/gemma-7b-it-GPTQ-selective

4B • Updated 9 days ago • 81

cpatonn/Qwen3-VL-32B-Instruct-AWQ-8bit

Image-Text-to-Text • 11B • Updated 9 days ago • 41

cpatonn/Qwen3-VL-32B-Thinking-AWQ-8bit

Image-Text-to-Text • 11B • Updated 9 days ago • 122 • 1