YeongminKim
/

zephyr-7b-dpo-full-alpha_0.5_batch32

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

zephyr-7b-dpo-full-alpha_0.5_batch32

14.5 GB

1 contributor

History: 22 commits

YeongminKim's picture

End of training

5266749 verified 9 months ago