iaminju
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO_pref

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen-1.5B-GRPO_pref

Commit History

Model save

c444c2c
verified

iaminju commited on Feb 25

Training in progress, epoch 0

fdb094c
verified

iaminju commited on Feb 25

initial commit

ab400a0
verified

iaminju commited on Feb 25