ogulcanakca commited on
Commit
bba7597
·
verified ·
1 Parent(s): 466d6a9

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +22 -0
README.md ADDED
@@ -0,0 +1,22 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ library_name: transformers
3
+ license: apache-2.0
4
+ pipeline_tag: text-generation
5
+ tags:
6
+ - AWQ
7
+ - vLLM
8
+ base_model:
9
+ - ogulcanakca/Kumru-2B-EPDK-Instruct
10
+ base_model_relation: quantized
11
+ ---
12
+ # Kumru-2B-EPDK-Instruct-AWQ-4bit
13
+
14
+ `ogulcanakca/Kumru-2B-EPDK-Instruct` modelinin **AWQ (Activation-aware Weight Quantization)** ile 4-bit’e quantize edilmiş sürümünü içerir. Model, EPDK mevzuatı dokümanları üzerinde domain-adapte edilmiş ve SFT/DPO ile talimat takibi güçlendirilmiştir.
15
+
16
+ ## Quantization Detayları
17
+
18
+ - Bit sayısı: `4` (`w_bit = 4`)
19
+ - Grup boyutu: `128` (`q_group_size = 128`)
20
+ - Zero point: `True` (`zero_point = True`)
21
+ - Format: `safetensors`
22
+ - Hedef kullanım: RAG + mevzuat asistanı senaryoları