NoManDeRY
/

DPO-Shift-Llama-3-8B-Ultrafeedback-decrease_linear-1.0to0.95

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DPO-Shift-Llama-3-8B-Ultrafeedback-decrease_linear-1.0to0.95

16.1 GB

1 contributor

History: 5 commits

NoManDeRY's picture

Update README.md

938df25 verified 10 months ago