ogulcanakca
/

Kumru-2B-EPDK-Instruct-GPTQ-4bit

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions

Kumru-2B-EPDK-Instruct-GPTQ-4bit

ogulcanakca/Kumru-2B-EPDK-Instruct modelinin GPTQ (4-bit post-training quantization) ile quantize edilmiş sürümünü içerir.

Quantization Detayları

Bit sayısı: 4
Dataset: "c4" (kalibrasyon için; Hugging Face tarafında otomatik çekilen küçük bir alt set)
Tokenizer: Aynı repo (ogulcanakca/Kumru-2B-EPDK-Instruct)
Hedef kullanım: GPU inference, RAG tabanlı hukuk/mevzuat asistanları

Downloads last month: 8

Safetensors

Model size

2B params

Tensor type

I32

·

F16

·

Model tree for ogulcanakca/Kumru-2B-EPDK-Instruct-GPTQ-4bit

Base model

vngrs-ai/Kumru-2B-Base

Finetuned

ogulcanakca/Kumru-2B-EPDK-Instruct

Quantized

(3)

this model