BadCat's picture

2 5 8

BadCat

Foresta

·

Aegis1863

AI & ML interests

LLMs Deep learning Reinforcement learning

Recent Activity

upvoted a paper about 22 hours ago

AT^2PO: Agentic Turn-based Policy Optimization via Tree Search

upvoted a paper 9 days ago

Evaluating Parameter Efficient Methods for RLVR

upvoted a paper 3 months ago

Refusal Falls off a Cliff: How Safety Alignment Fails in Reasoning?

View all activity

Organizations

None yet

upvoted a paper about 22 hours ago

AT^2PO: Agentic Turn-based Policy Optimization via Tree Search

Paper • 2601.04767 • Published 2 days ago • 21

upvoted a paper 9 days ago

Evaluating Parameter Efficient Methods for RLVR

Paper • 2512.23165 • Published 12 days ago • 24

upvoted a paper 3 months ago

Refusal Falls off a Cliff: How Safety Alignment Fails in Reasoning?

Paper • 2510.06036 • Published Oct 7, 2025 • 6

upvoted a paper 5 months ago

OpenCUA: Open Foundations for Computer-Use Agents

Paper • 2508.09123 • Published Aug 12, 2025 • 31