Yukang
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO / training_args.bin

Commit History

Training in progress, step 2700

0b0d2f3
verified

Yukang commited on Jun 12

Training in progress, step 2300

346c49b
verified

Yukang commited on Jun 11

Training in progress, step 1900

23d6b79
verified

Yukang commited on Jun 11

Training in progress, step 1500

12577e0
verified

Yukang commited on Jun 11

Training in progress, step 1100

fb735e9
verified

Yukang commited on Jun 11

Training in progress, step 1000

9e288f8
verified

Yukang commited on Jun 11

Training in progress, step 600

f5893e7
verified

Yukang commited on Jun 11

Training in progress, step 500

0d4c886
verified

Yukang commited on Jun 11

Training in progress, step 100

2151a5c
verified

Yukang commited on Jun 10