PingchengDong's picture

2 5

PingchengDong

heisei

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 13 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

liked a model about 1 month ago

nvidia/DLER-R1-7B-Research

liked a model about 1 month ago

nvidia/DLER-Llama-Nemotron-8B-Merge-Research

View all activity

Organizations

None yet

upvoted a paper 13 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published 13 days ago • 202

liked 3 models about 1 month ago

nvidia/DLER-R1-7B-Research

8B • Updated Oct 25, 2025 • 10.9k • 15

nvidia/DLER-Llama-Nemotron-8B-Merge-Research

8B • Updated Oct 25, 2025 • 85 • 15

nvidia/DLER-R1-1.5B-Research

2B • Updated Oct 25, 2025 • 99.6k • 17

upvoted a collection 3 months ago

Reasoning Efficiency Research

Ultra-efficient reasoning model! SOTA Accuracy / CoT Length trade-offs • 3 items • Updated 1 day ago • 11

liked a model almost 2 years ago

Palak/albert-base-v2_squad

Question Answering • Updated Dec 24, 2021 • 1 • 1

liked a Space almost 2 years ago

Depth Anything

Generate depth map from an image