ARPO - a dongguanting Collection

Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

dongguanting 's Collections

AEPO

ARPO

ARPO

updated 18 days ago

The official datasets and model checkpoints of ARPO

Agentic Reinforced Policy Optimization

Paper • 2507.19849 • Published Jul 26 • 156
dongguanting/Qwen3-8B-ARPO-DeepSearch

8B • Updated Jul 29 • 26 • 2
dongguanting/Qwen3-14B-ARPO-DeepSearch

Text Generation • 15B • Updated Aug 12 • 44 • 5
dongguanting/Qwen2.5-7B-ARPO

Text Generation • 8B • Updated Aug 19 • 13 • 2
dongguanting/Llama3.1-8B-ARPO

Text Generation • 8B • Updated Aug 12 • 7 • 1
dongguanting/Qwen2.5-3B-ARPO

Text Generation • 3B • Updated Aug 12 • 17 • 3
dongguanting/ARPO-SFT-54K

Viewer • Updated 16 days ago • 54.6k • 218 • 11
dongguanting/ARPO-RL-Reasoning-10K

Viewer • Updated 16 days ago • 10k • 153 • 3
dongguanting/ARPO-RL-DeepSearch-1K

Viewer • Updated 16 days ago • 1.07k • 105 • 4

Collection guide
Browse collections

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs