skaltenp
/

Llama3.2-3B-Thinking-DPO

Generated from Trainer

Model card Files Files and versions

Llama3.2-3B-Thinking-DPO

212 MB

1 contributor

History: 2 commits

skaltenp's picture

Training in progress, step 200

ba5eb8c verified 14 days ago

.gitattributes

1.57 kB

Training in progress, step 200 14 days ago
README.md

2.45 kB

Training in progress, step 200 14 days ago
adapter_config.json

1.17 kB

Training in progress, step 200 14 days ago
adapter_model.safetensors

195 MB
xet

Training in progress, step 200 14 days ago
chat_template.jinja

3.83 kB

Training in progress, step 200 14 days ago
special_tokens_map.json

296 Bytes

Training in progress, step 200 14 days ago
tokenizer.json

17.2 MB
xet

Training in progress, step 200 14 days ago
tokenizer_config.json

50.5 kB

Training in progress, step 200 14 days ago
training_args.bin
Detected Pickle imports (11)
- "transformers.trainer_utils.IntervalStrategy",
- "accelerate.state.PartialState",
- "trl.trainer.dpo_config.DPOConfig",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.SaveStrategy",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_utils.SchedulerType",
- "torch.device",
- "trl.trainer.dpo_config.FDivergenceType"
How to fix it?
6.8 kB
xet

Training in progress, step 200 14 days ago