tmd-rahul
/

tmd-chat-bot

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

tmd-rahul commited on Mar 31

Commit

ccc5da2

·

verified ·

1 Parent(s): d5499ab

End of training

Files changed (1) hide show

README.md +10 -8

README.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
-library_name: transformers
-license: mit
-base_model: tmd-rahul/tmd-chat-bot
 tags:
 - generated_from_trainer
 model-index:
@@ -14,7 +14,7 @@ should probably proofread and complete it, then remove this comment. -->
 # tmd-chat-bot
-This model is a fine-tuned version of [tmd-rahul/tmd-chat-bot](https://huggingface.co/tmd-rahul/tmd-chat-bot) on the None dataset.
 ## Model description
@@ -33,13 +33,14 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 5e-05
-- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 2
 ### Training results
@@ -47,7 +48,8 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.50.3
 - Pytorch 2.6.0+cu124
 - Datasets 3.5.0
-- Tokenizers 0.21.1

 ---
+library_name: peft
+license: gemma
+base_model: google/gemma-2b-it
 tags:
 - generated_from_trainer
 model-index:
 # tmd-chat-bot
+This model is a fine-tuned version of [google/gemma-2b-it](https://huggingface.co/google/gemma-2b-it) on the None dataset.
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.0002
+- train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 2
+- mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
+- PEFT 0.14.0
+- Transformers 4.50.0
 - Pytorch 2.6.0+cu124
 - Datasets 3.5.0
+- Tokenizers 0.21.1