areegtarek
/

idefics-9b-instruct-all-v3

Image-Text-to-Text

text-generation-inference

4-bit precision

Model card Files Files and versions

areegtarek commited on Mar 25, 2024

Commit

cd3918d

·

verified ·

1 Parent(s): ba1b172

Update README.md

Files changed (1) hide show

README.md +22 -0

README.md CHANGED Viewed

@@ -10,6 +10,28 @@ tags: []
 ## Model Details
 ### Model Description

 ## Model Details
+r = 32,
+    lora_alpha = 64,
+    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj",
+                      "gate_proj", "up_proj", "down_proj"],
+    lora_dropout = 0.1,
+    bias="none"
+)
+model = get_peft_model(model, config)
+model.print_trainable_parameters()
+training_args = TrainingArguments(
+    output_dir = f"{model_name}-logo",
+    dataloader_pin_memory = False,
+    logging_steps = 1,
+    remove_unused_columns = False,
+    push_to_hub=False,
+    label_names= ["labels"],
+    num_train_epochs = 10,
+    per_device_train_batch_size = 1,
+    gradient_accumulation_steps = 1,
+    warmup_steps = 0.1,
+    save_total_limit=5,
+    max_grad_norm=0.3,
 ### Model Description