NoManDeRY
/

DPO-Shift-Llama-3-8B-Ultrafeedback-decrease_linear-1.0to0.95

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DPO-Shift-Llama-3-8B-Ultrafeedback-decrease_linear-1.0to0.95 / trainer_state.json

NoManDeRY's picture

Upload folder using huggingface_hub

ce72571 verified 10 months ago

history contribute delete

276 kB

File too large to display, you can check the raw version instead.