NoManDeRY
/

DPO-Shift-Llama-3-8B-Ultrafeedback-decrease_linear-1.0to0.95

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DPO-Shift-Llama-3-8B-Ultrafeedback-decrease_linear-1.0to0.95

1.54 kB

1 contributor

History: 1 commit

NoManDeRY's picture

initial commit

db054ac verified 11 months ago