ZhuofengLi (ZhuofengLi)

Papers 6

arxiv:2510.05592

arxiv:2509.22799

arxiv:2509.01055

arxiv:2505.20139

models 17

datasets 15

ZhuofengLi/lambda-sft-code-data-gen-st-debug

Viewer • Updated 10 days ago • 5 • 23

ZhuofengLi/lambda-sft-math-data-gen-st-debug

Viewer • Updated 10 days ago • 5 • 30

ZhuofengLi/deepreview-fast-sft-v2

Viewer • Updated 14 days ago • 13.3k • 13

ZhuofengLi/ICLR_26

Viewer • Updated 22 days ago • 19.6k • 34

ZhuofengLi/deepreview-fast-sft

Viewer • Updated 27 days ago • 13.4k • 55

ZhuofengLi/deepreview-sft

Viewer • Updated Nov 1 • 41.4k • 43

ZhuofengLi/deepreview-synthesis-sft

Viewer • Updated Nov 1 • 13.4k • 9

ZhuofengLi/sft_data

Viewer • Updated Sep 19 • 8.4k • 17

ZhuofengLi/gpqa_mcq

Viewer • Updated Jul 14 • 198 • 13

ZhuofengLi/Big-Math-RL-Verified

Viewer • Updated Mar 14 • 251k • 19

View 15 datasets

ZhuofengLi

AI & ML interests

Organizations

Papers 6

models 17

ZhuofengLi/Qwen3-4B-Instruct-2507-DeepReview-lora-sft-ms-swift-v2

ZhuofengLi/Qwen3-4B-Instruct-2507-DeepReview-lora-sft-ms-swift-new

ZhuofengLi/Qwen3-4B-Instruct-2507-DeepReview-lora-sft-ms-swift

ZhuofengLi/Qwen3-4B-Instruct-2507-DeepReview-lora-sft

ZhuofengLi/torl-qwen2.5-7b-instruct

ZhuofengLi/octo-science-qwen2.5-7b-grpo-step-40-v2

ZhuofengLi/octo-search-qwen2.5-7b-grpo-155-step-v1

ZhuofengLi/octo-search-qwen2.5-7b-grpo-step-60-v1.5

ZhuofengLi/tool-n1-multi-turn-reason-lora-sft-1180-step

ZhuofengLi/xlam-reason-lora-sft-1340-step

datasets 15

ZhuofengLi/lambda-sft-code-data-gen-st-debug

ZhuofengLi/lambda-sft-math-data-gen-st-debug

ZhuofengLi/deepreview-fast-sft-v2

ZhuofengLi/ICLR_26

ZhuofengLi/deepreview-fast-sft

ZhuofengLi/deepreview-sft

ZhuofengLi/deepreview-synthesis-sft

ZhuofengLi/sft_data

ZhuofengLi/gpqa_mcq

ZhuofengLi/Big-Math-RL-Verified

ZhuofengLi

AI & ML interests

Organizations

Papers 6

models 17 Sort: Recently updated

datasets 15 Sort: Recently updated

models 17

datasets 15