Nguyen Vy's picture

1

Nguyen Vy

ntthuyvy73

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 16 days ago

DeepSearch: Overcome the Bottleneck of Reinforcement Learning with Verifiable Rewards via Monte Carlo Tree Search

published a model 29 days ago

ntthuyvy73/Qwen3-4B_SFT-MCQ-v1

published a model about 1 month ago

ntthuyvy73/Qwen3-4B-RLHF-GRPO_v7_lora_merge

View all activity

Organizations

models 20

ntthuyvy73/Qwen3-4B_SFT-MCQ-v1

Updated 29 days ago

ntthuyvy73/Qwen3-4B-RLHF-GRPO_v7_lora_merge

ntthuyvy73/Qwen3-4B-RLHF-DPO_v7_lora_merge

ntthuyvy73/Qwen3-4B-RLHF-GRPO_v7

4B • Updated Nov 13 • 21

ntthuyvy73/Qwen3-4B-RLHF-DPO_v7

ntthuyvy73/Qwen3-4B_RLHF-SFT-v7

Text Generation • 4B • Updated Nov 11 • 12

ntthuyvy73/Qwen3-4B-RLHF-SFT_v6

Text Generation • 4B • Updated Nov 10 • 5

ntthuyvy73/Qwen3-1.7B_RLHF_SFT_full

2B • Updated Nov 10 • 4

ntthuyvy73/Qwen3-1.7B_RLHF_SFT

ntthuyvy73/Qwen3-4B-RLHF-SFT_v4

Text Generation • 4B • Updated Nov 9 • 4

datasets 1

ntthuyvy73/vlaw-train

Viewer • Updated Jul 2 • 57.5k • 22