YeongminKim
/

zephyr-7b-dpo-full-alpha_0.5_batch32

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

zephyr-7b-dpo-full-alpha_0.5_batch32

14.5 GB

1 contributor

History: 10 commits

YeongminKim's picture

Training in progress, step 900

e789e47 verified 8 months ago