2 5

Yushi Huang

Harahan

Harahan

AI & ML interests

None yet

Recent Activity

authored a paper 19 days ago

SlimInfer: Accelerating Long-Context LLM Inference via Dynamic Token Pruning

authored a paper 19 days ago

LinVideo: A Post-Training Framework towards O(n) Attention in Efficient Video Generation

upvoted a paper 4 months ago

WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research

View all activity

Organizations

None yet

authored 2 papers 19 days ago

SlimInfer: Accelerating Long-Context LLM Inference via Dynamic Token Pruning

Paper • 2508.06447 • Published Aug 8, 2025

LinVideo: A Post-Training Framework towards O(n) Attention in Efficient Video Generation

Paper • 2510.08318 • Published Oct 9, 2025

upvoted a paper 4 months ago

WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research

Paper • 2509.13312 • Published Sep 16, 2025 • 105

authored a paper 4 months ago

LLMC+: Benchmarking Vision-Language Model Compression with a Plug-and-play Toolkit

Paper • 2508.09981 • Published Aug 13, 2025 • 2

upvoted a paper 7 months ago

PAROAttention: Pattern-Aware ReOrdering for Efficient Sparse and Quantized Attention in Visual Generation Models

Paper • 2506.16054 • Published Jun 19, 2025 • 60

upvoted a paper 8 months ago

QVGen: Pushing the Limit of Quantized Video Generative Models

Paper • 2505.11497 • Published May 16, 2025 • 4

authored a paper 8 months ago

QVGen: Pushing the Limit of Quantized Video Generative Models

Paper • 2505.11497 • Published May 16, 2025 • 4

commented a paper 8 months ago

QVGen: Pushing the Limit of Quantized Video Generative Models

Paper • 2505.11497 • Published May 16, 2025 • 4 •

authored a paper over 1 year ago

HarmoniCa: Harmonizing Training and Inference for Better Feature Cache in Diffusion Transformer Acceleration

Paper • 2410.01723 • Published Oct 2, 2024 • 4

upvoted a paper over 1 year ago

HarmoniCa: Harmonizing Training and Inference for Better Feature Cache in Diffusion Transformer Acceleration

Paper • 2410.01723 • Published Oct 2, 2024 • 4

commented a paper over 1 year ago

HarmoniCa: Harmonizing Training and Inference for Better Feature Cache in Diffusion Transformer Acceleration

Paper • 2410.01723 • Published Oct 2, 2024 • 4 •

upvoted a paper almost 2 years ago

Rethinking FID: Towards a Better Evaluation Metric for Image Generation

Paper • 2401.09603 • Published Nov 30, 2023 • 17

authored a paper about 2 years ago

TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion Models

Paper • 2311.16503 • Published Nov 27, 2023

Yushi Huang

AI & ML interests

Recent Activity

Organizations

Harahan's activity