PKU-Alignment
/

beaver-7b-v1.0-cost

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions

beaver-7b-v1.0-cost / tokenizer.json

XuehaiPan's picture

Convert model checkpoint to safetensors

1070fa3 over 1 year ago

1.84 MB

File too large to display, you can check the raw version instead.