Yikun Ban's picture

1 5

Yikun Ban

Yikunb

·

https://www.banyikun.com/

AI & ML interests

Reinforcement Learning

Recent Activity

upvoted a paper 1 day ago

Your Group-Relative Advantage Is Biased

upvoted a collection 2 days ago

submitted a paper 2 days ago

Your Group-Relative Advantage Is Biased

View all activity

Organizations

None yet

upvoted a paper 1 day ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published 8 days ago • 128

upvoted a collection 2 days ago

cool-papers

82 items • Updated about 2 hours ago • 6

submitted a paper to Daily Papers 2 days ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published 8 days ago • 128

authored 2 papers 5 days ago

Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning

Paper • 2505.16270 • Published May 22, 2025 • 6

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published 8 days ago • 128

commented 2 papers 6 days ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published 8 days ago • 128 •

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published 8 days ago • 128 •

upvoted a paper 4 months ago

TaTToo: Tool-Grounded Thinking PRM for Test-Time Scaling in Tabular Reasoning

Paper • 2510.06217 • Published Oct 7, 2025 • 64

upvoted a paper 7 months ago

ReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMs

Paper • 2506.18896 • Published Jun 23, 2025 • 29

upvoted a paper 8 months ago

Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning

Paper • 2505.16270 • Published May 22, 2025 • 6