launch
/

ThinkPRM-7B

Text Generation

generative reward model

process supervision

chain-of-thought

code verification

text-generation-inference

Model card Files Files and versions

Commit History

Update README.md

b61c5be
verified

mkhalifa commited on May 17

Upload Qwen2ForCausalLM

2ba8136
verified

mkhalifa commited on May 17

Upload tokenizer

a6b7d60
verified

mkhalifa commited on May 17

initial commit

cff4352
verified

mkhalifa commited on May 17