NoManDeRY
/

DPO-Shift-Llama-3-8B-Ultrafeedback-decrease_linear-1.0to0.95

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DPO-Shift-Llama-3-8B-Ultrafeedback-decrease_linear-1.0to0.95

Commit History

Add pipeline tag and Github link

8ac6170
verified

nielsr HF Staff commited on Jun 9, 2025

Update README.md

938df25
verified

NoManDeRY commited on Feb 18, 2025

Update README.md

6839fbc
verified

NoManDeRY commited on Feb 17, 2025

Update README.md

9baa155
verified

NoManDeRY commited on Feb 17, 2025

Upload folder using huggingface_hub

ce72571
verified

NoManDeRY commited on Feb 17, 2025

initial commit

db054ac
verified

NoManDeRY commited on Feb 17, 2025