Junyi Li's picture

9 11

Junyi Li

ProvenceStar

·

https://provencestar.github.io/

ProvenceStar

AI & ML interests

Multimodal Model, Reinforcement Learning

Recent Activity

liked a model 2 days ago

zsgvivo/videozoomer

upvoted a paper 14 days ago

Alchemist: Unlocking Efficiency in Text-to-Image Model Training via Meta-Gradient Data Selection

upvoted a paper 17 days ago

DrivePI: Spatial-aware 4D MLLM for Unified Autonomous Driving Understanding, Perception, Prediction and Planning

View all activity

Organizations

None yet

upvoted a paper 14 days ago

Alchemist: Unlocking Efficiency in Text-to-Image Model Training via Meta-Gradient Data Selection

Paper • 2512.16905 • Published 15 days ago • 30

upvoted a paper 17 days ago

DrivePI: Spatial-aware 4D MLLM for Unified Autonomous Driving Understanding, Perception, Prediction and Planning

Paper • 2512.12799 • Published 19 days ago • 10

upvoted 2 papers 4 months ago

ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data

Paper • 2509.15221 • Published Sep 18, 2025 • 111

Mini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual Search

Paper • 2509.07969 • Published Sep 9, 2025 • 58

upvoted 2 collections 4 months ago

VisionThink

Efficient Reasoning Vision Language Model • 7 items • Updated Jul 18, 2025 • 7

Mini-o3

Scaling Up Reasoning Patterns and Interaction Turns for Visual Search • 7 items • Updated Sep 9, 2025 • 1

upvoted 2 papers 6 months ago

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

Paper • 2507.13348 • Published Jul 17, 2025 • 77

MMSearch-R1: Incentivizing LMMs to Search

Paper • 2506.20670 • Published Jun 25, 2025 • 64

upvoted a paper about 1 year ago

VisionZip: Longer is Better but Not Necessary in Vision Language Models

Paper • 2412.04467 • Published Dec 5, 2024 • 117