dolfsai
/

Jan-nano-128k-W8A8

Text Generation

8-bit precision

compressed-tensors

Model card Files Files and versions

dolfsai/Jan-nano-128k-W8A8

This is a compressed version of Menlo/Jan-nano-128k using llm-compressor with the following scheme: W8A8 Usage instructions and details here

Model Details

Original Model: Menlo/Jan-nano-128k
Quantization Method: GPTQ
Compression Libraries: llm-compressor
Calibration Dataset: ultrachat_200k (1024 samples)
Optimized For: Inference with vLLM
License: same as original model

Downloads last month: 9

Safetensors

Model size

4B params

Tensor type

BF16

·

I8

·

Model tree for dolfsai/Jan-nano-128k-W8A8

Base model

Qwen/Qwen3-4B-Base

Finetuned

Finetuned

Finetuned

Menlo/Jan-nano-128k

Quantized

(18)

this model

Dataset used to train dolfsai/Jan-nano-128k-W8A8