Eugene Tarassov's picture

1 1

Eugene Tarassov

etarassov

·

e-tarassov

AI & ML interests

None yet

Organizations

None yet

authored 2 papers over 1 year ago

Offline Regularised Reinforcement Learning for Large Language Models Alignment

Paper • 2405.19107 • Published May 29, 2024 • 15

Understanding the performance gap between online and offline alignment algorithms

Paper • 2405.08448 • Published May 14, 2024 • 18