8 88 16

Xiaoye Qu

Xiaoye08

AI & ML interests

None yet

Recent Activity

upvoted a paper 11 days ago

UniGenBench++: A Unified Semantic Evaluation Benchmark for Text-to-Image Generation

upvoted a collection 19 days ago

VPPO Model

liked a model 19 days ago

chamber111/VPPO-7B

View all activity

Organizations

upvoted a paper 11 days ago

UniGenBench++: A Unified Semantic Evaluation Benchmark for Text-to-Image Generation

Paper • 2510.18701 • Published 12 days ago • 66

upvoted a collection 19 days ago

VPPO Model

Collection

SOTA models for multimodal reasoning, fine-tuned with VPPO. Achieves superior performance by focusing on critical visual tokens. • 3 items • Updated 20 days ago • 3

liked 2 models 19 days ago

chamber111/VPPO-7B

Image-Text-to-Text • 8B • Updated 17 days ago • 58 • 4

chamber111/VPPO-32B

33B • Updated 17 days ago • 49 • 2

commented 2 papers 19 days ago

Spotlight on Token Perception for Multimodal Reinforcement Learning

Paper • 2510.09285 • Published 23 days ago • 35 •

Spotlight on Token Perception for Multimodal Reinforcement Learning

Paper • 2510.09285 • Published 23 days ago • 35 •

upvoted a paper 20 days ago

Spotlight on Token Perception for Multimodal Reinforcement Learning

Paper • 2510.09285 • Published 23 days ago • 35

upvoted a paper 21 days ago

UniVideo: Unified Understanding, Generation, and Editing for Videos

Paper • 2510.08377 • Published 24 days ago • 68

upvoted a paper 23 days ago

Agent Learning via Early Experience

Paper • 2510.08558 • Published 24 days ago • 255

upvoted a paper 24 days ago

Diversity-Incentivized Exploration for Versatile Reasoning

Paper • 2509.26209 • Published Sep 30 • 16

upvoted 2 papers 25 days ago

Less is More: Recursive Reasoning with Tiny Networks

Paper • 2510.04871 • Published 27 days ago • 462

GRACE: Generative Representation Learning via Contrastive Policy Optimization

Paper • 2510.04506 • Published 27 days ago • 10

upvoted a paper about 1 month ago

ExGRPO: Learning to Reason from Experience

Paper • 2510.02245 • Published about 1 month ago • 77

commented a paper about 1 month ago

FrameThinker: Learning to Think with Long Videos via Multi-Turn Frame Spotlighting

Paper • 2509.24304 • Published Sep 29 • 4 •

upvoted a paper about 1 month ago

FrameThinker: Learning to Think with Long Videos via Multi-Turn Frame Spotlighting

Paper • 2509.24304 • Published Sep 29 • 4

commented a paper about 1 month ago

FrameThinker: Learning to Think with Long Videos via Multi-Turn Frame Spotlighting

Paper • 2509.24304 • Published Sep 29 • 4 •

upvoted 2 papers about 1 month ago

ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data

Paper • 2509.15221 • Published Sep 18 • 109

Reasoning over Boundaries: Enhancing Specification Alignment via Test-time Delibration

Paper • 2509.14760 • Published Sep 18 • 52

upvoted 2 papers about 2 months ago

SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning

Paper • 2509.09674 • Published Sep 11 • 78

A Survey of Reinforcement Learning for Large Reasoning Models

Paper • 2509.08827 • Published Sep 10 • 185

Xiaoye Qu

AI & ML interests

Recent Activity

Organizations

Xiaoye08's activity