BadCat's picture

2 5 8

BadCat

Foresta

·

Aegis1863

AI & ML interests

LLMs Deep learning Reinforcement learning

Recent Activity

upvoted a paper 3 days ago

AT^2PO: Agentic Turn-based Policy Optimization via Tree Search

upvoted a paper 11 days ago

Evaluating Parameter Efficient Methods for RLVR

upvoted a paper 3 months ago

Refusal Falls off a Cliff: How Safety Alignment Fails in Reasoning?

View all activity

Organizations

None yet

Foresta 's datasets

None public yet