chencyu's picture

9 51

chencyu

chencyu

·

chencyu

AI & ML interests

All

Recent Activity

liked a model 10 days ago

PaddlePaddle/PaddleOCR-VL

liked a model 21 days ago

inclusionAI/Ling-1T

upvoted a paper 22 days ago

Reactive Transformer (RxT) -- Stateful Real-Time Processing for Event-Driven Reactive Language Models

View all activity

Organizations

None yet

upvoted a paper 22 days ago

Reactive Transformer (RxT) -- Stateful Real-Time Processing for Event-Driven Reactive Language Models

Paper • 2510.03561 • Published about 1 month ago • 23

upvoted a paper 9 months ago

LM2: Large Memory Models

Paper • 2502.06049 • Published Feb 9 • 30

upvoted a collection about 1 year ago

SSMs

A collection of Mamba-2-based research models with 8B parameters trained on 3.5T tokens for comparison with Transformers. • 5 items • Updated 13 days ago • 29

upvoted a paper about 1 year ago

Kolmogorov-Arnold Transformer

Paper • 2409.10594 • Published Sep 16, 2024 • 45

upvoted a paper over 1 year ago

MambaVision: A Hybrid Mamba-Transformer Vision Backbone

Paper • 2407.08083 • Published Jul 10, 2024 • 32

upvoted a collection over 1 year ago

Nemotron 4 340B

Nemotron-4: open models for Synthetic Data Generation (SDG). Includes Base, Instruct, and Reward models. • 4 items • Updated 13 days ago • 162

upvoted a paper over 1 year ago

OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework

Paper • 2404.14619 • Published Apr 22, 2024 • 126

upvoted an article over 1 year ago

Article

Run the strongest open-source LLM model: Llama3 70B with just a single 4GB GPU!

By

•

Apr 21, 2024

• 44