16 10 30

Shuai Zhao

mzhaoshuai

https://mzhaoshuai.github.io/

mzhaoshuai

AI & ML interests

foundation models

Recent Activity

liked a Space 2 days ago

muset-ai/DeepResearch-Bench-Leaderboard

liked a dataset 10 days ago

cais/hle

upvoted a paper about 1 month ago

Unified Video Editing with Temporal Reasoner

View all activity

Organizations

Collections 1

Papers 5

models 15

datasets 5

mzhaoshuai/Llama-3.3-70B-Inst-awq_ultrafeedback_1in3

Viewer • Updated Oct 16, 2025 • 61.1k • 42

mzhaoshuai/Llama-3.3-70B-Inst-awq_SafeRLHF

Preview • Updated Oct 16, 2025 • 29

mzhaoshuai/NQ-Subset-500

Viewer • Updated Oct 16, 2025 • 500 • 11

mzhaoshuai/llama3-ultrafeedback-bertscore-bart-large-mnli

Viewer • Updated Oct 16, 2025 • 60.9k • 22

mzhaoshuai/Llama-3.3-70B-Inst-awq_ultrafeedback

Viewer • Updated Aug 9, 2025 • 61.1k • 5

Shuai Zhao

AI & ML interests

Recent Activity

Organizations

Collections 1

Learning from Reference Answers: Versatile Language Model Alignment without Binary Human Preference Data

mzhaoshuai/Llama-3.3-70B-Inst-awq_ultrafeedback_1in3

mzhaoshuai/Llama-3.3-70B-Inst-awq_SafeRLHF

mzhaoshuai/NQ-Subset-500

Learning from Reference Answers: Versatile Language Model Alignment without Binary Human Preference Data

mzhaoshuai/Llama-3.3-70B-Inst-awq_ultrafeedback_1in3

mzhaoshuai/Llama-3.3-70B-Inst-awq_SafeRLHF

mzhaoshuai/NQ-Subset-500

Papers 5

models 15

mzhaoshuai/CLIP4STR

mzhaoshuai/Mistral-7B-v0.1-conf-sft

mzhaoshuai/Llama-3-8B-Instruct-refalign

mzhaoshuai/Mistral-7B-Instruct-v0.2-refalign

mzhaoshuai/Llama-2-7b-hf-conf-refalign

mzhaoshuai/Mistral-7B-v0.1-conf-refalign

mzhaoshuai/Llama-3-8B-Instruct-ref-simpo

mzhaoshuai/alpaca-7b-ref-meteor

mzhaoshuai/alpaca-7b-ref-bertscore

mzhaoshuai/Llama-2-13b-hf-conf-refalign

datasets 5

mzhaoshuai/Llama-3.3-70B-Inst-awq_ultrafeedback_1in3

mzhaoshuai/Llama-3.3-70B-Inst-awq_SafeRLHF

mzhaoshuai/NQ-Subset-500

mzhaoshuai/llama3-ultrafeedback-bertscore-bart-large-mnli

mzhaoshuai/Llama-3.3-70B-Inst-awq_ultrafeedback

Shuai Zhao

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 5

models 15 Sort: Recently updated

datasets 5 Sort: Recently updated

models 15

datasets 5