Francesco Periti's picture

1 2 2

Francesco Periti

FrancescoPeriti

·

https://francescoperiti.github.io/

AI & ML interests

None yet

Organizations

upvoted 2 articles 8 months ago

Article

DeepSeek-R1 Dissection: Understanding PPO & GRPO Without Any Prior Reinforcement Learning Knowledge

Feb 7

•

263

Article

Reinforcement Learning for Large Language Models: Beyond the Agent Paradigm

Mar 19

•

8