E's picture

4 1

E

enio

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 12 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

upvoted a paper 6 months ago

Qwen3 Technical Report

upvoted a paper 6 months ago

MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention

View all activity

Organizations

upvoted a paper 12 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published 15 days ago • 203

upvoted 3 papers 6 months ago

Qwen3 Technical Report

Paper • 2505.09388 • Published May 14, 2025 • 323

MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention

Paper • 2506.13585 • Published Jun 16, 2025 • 273

Group Sequence Policy Optimization

Paper • 2507.18071 • Published Jul 24, 2025 • 316