hhdqirui
/

Qwen2-7B-Instruct-GRPO-8

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-7B-Instruct-GRPO-8 / training_args.bin

Commit History

Training in progress, step 10

8cea10b
verified

hhdqirui commited on Apr 29

Training in progress, step 10

961e9b3
verified

hhdqirui commited on Apr 28