Edit Models filters

Apps

Inference Providers

HF Inference API

Misc

compressed-tensors

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

3,050

Full-text search

Active filters: compressed-tensors

ronantakizawa/idefics3-8b-llama3-awq

Image-Text-to-Text • 2B • Updated 16 days ago • 6 • 1

ronantakizawa/molmo-7b-d-awq

Image-Text-to-Text • 2B • Updated 15 days ago • 19 • 2

ronantakizawa/molmoact-7b-d-awq

Image-Text-to-Text • 2B • Updated 15 days ago • 5 • 1

nm-testing/Qwen3-VL-4B-Instruct-NVFP4

3B • Updated 15 days ago • 151

nm-testing/Qwen3-VL-8B-Instruct-NVFP4

6B • Updated 15 days ago • 39

nm-testing/Qwen3-VL-8B-Instruct-W4A16

3B • Updated 15 days ago • 28

abhishekchohan/maesar-30B-A3B-W4A16-testing

5B • Updated 15 days ago • 21

ronantakizawa/olmo2-32b-instruct-awq

Text Generation • 5B • Updated 15 days ago • 4 • 1

abhishekchohan/maesar-30B-A3B-FP8

31B • Updated 15 days ago • 24

jart25/Qwen3-VL-30B-A3B-Instruct-AWQ-8bit

10B • Updated 15 days ago • 191 • 3

ronantakizawa/molmo-72b-awq

Image-Text-to-Text • 11B • Updated 15 days ago • 55 • 1

Benasd/Qwen3-VL-30B-A3B-Instruct-NVFP4

18B • Updated 14 days ago • 67

jart25/Qwen3-VL-30B-A3B-Instruct-AWQ-4bit

6B • Updated 14 days ago • 205 • 1

Benasd/Qwen3-VL-30B-A3B-Thinking-NVFP4

18B • Updated 14 days ago • 57

Benasd/Qwen3-VL-30B-A3B-Thinking-FP8

31B • Updated 14 days ago • 39

ConicCat/Magistral-Small-2509-Text-Only-FP8-Dynamic

24B • Updated 14 days ago • 93

Benasd/Qwen3-VL-30B-A3B-Instruct-FP8

31B • Updated 14 days ago • 24

Sinensis/Cydonia-24B-v4.2.0-W8A8

24B • Updated 14 days ago • 3

KsuserKqy/DeepSeek-R1-Distill-Qwen-7B-AWQ-INT4

2B • Updated 12 days ago • 31

Benasd/Qwen3-VL-30B-A3B-Instruct-FP8-BLOCK

31B • Updated 14 days ago • 24

Benasd/Qwen3-VL-30B-A3B-Thinking-FP8-BLOCK

31B • Updated 14 days ago • 11

Benasd/Qwen3-VL-30B-A3B-Instruct-FP8-MIXED

31B • Updated 14 days ago • 23

Benasd/Qwen3-VL-30B-A3B-Instruct-FP8-BLOCK-MIXED

31B • Updated 14 days ago • 17

Benasd/Qwen3-VL-30B-A3B-Thinking-FP8-BLOCK-MIXED

31B • Updated 14 days ago • 7

Benasd/Qwen3-VL-30B-A3B-Thinking-FP8-MIXED

31B • Updated 14 days ago • 21

shadowlilac/ml-foundations-posttrain-12b-W8A16

5B • Updated 14 days ago • 48

mratsim/Seed-OSS-36B-Instruct-FP8-KV8

Text Generation • 36B • Updated 14 days ago • 62

Sinensis/Cydonia-24B-v4.2.0-FP8-Dynamic

24B • Updated 14 days ago • 13

Benasd/Qwen3-VL-30B-A3B-Instruct-NVFP4-FP8-MIXED

19B • Updated 13 days ago • 74

Benasd/Qwen3-VL-30B-A3B-Instruct-NVFP4-BF16-MIXED

19B • Updated 13 days ago • 50