Zen Embedding 0.6B GGUF

High-performance text embedding model based on Qwen3-Embedding, optimized for efficient inference.

Downloads

Source	URL
HuggingFace	`hf download zenlm/zen-embedding-0.6B-GGUF`
Direct	https://download.hanzo.ai/llm-models/zen-embedding-0.6B-Q8_0.gguf

Works with llama.cpp and compatible inference engines.

Apache 2.0 (inherited from Qwen3-Embedding)

GGUF

Model size

0.6B params

Architecture

qwen3

Hardware compatibility

8-bit

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Finetuned

Quantized

(29)

this model