Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

sentence-transformers

Transformers.js

Apps

Inference Providers

Models

1,365

Full-text search

Active filters: reinforcement-learning, transformers

vicfeuga/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 2, 2023 • 12

habanoz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 6

FabioDataGeek/ppo-LunarLander-v2

Reinforcement Learning • Updated May 2, 2023 • 14

mkahari/RL_testing

Reinforcement Learning • Updated Jan 11, 2023 • 12

arenbeglaryan/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 8, 2023 • 6

MHaurel/ppo-LunarLander-v2

Reinforcement Learning • Updated May 30, 2023 • 10

akoshel/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 27, 2023 • 10

rootacess/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 5, 2023 • 6

morganjeffries/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 19, 2023 • 6

jrnold/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 1, 2023 • 8

lewtun/dummy-trl-model

Reinforcement Learning • Updated Jan 24, 2023 • 12 • 1

stinoco/PPO-LunarLander-v2

Reinforcement Learning • Updated Mar 6, 2023 • 7

mili7522/ppo-cleanrl-LunarLander-v2

Reinforcement Learning • Updated Apr 16, 2023 • 10

EdenYav/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 22, 2023 • 5

victorivus/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 3, 2023 • 9

slopezay/ppo-LunarLander-v2

Reinforcement Learning • Updated May 20, 2023 • 10

nikogarro/PPO-LunarLander-v2

Reinforcement Learning • Updated Feb 16, 2023 • 7

jamesthong/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 8

ybelkada/gpt-neo-125m-detox

Reinforcement Learning • Updated Feb 17, 2023 • 12

ybelkada/gpt-neo-125m-detoxified-long-context

Reinforcement Learning • Updated Feb 17, 2023 • 7

dungtd2403/CartPole-v1

Reinforcement Learning • Updated Mar 5, 2023 • 8

ZhihongDeng/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 30, 2023 • 7

mkuntz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 8

Gabcsor/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 13, 2023 • 7

dcduplooy/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 15, 2023 • 6

Yureeh/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 6, 2023 • 10

TRiddle/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 21, 2023 • 9

JulianZas/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 27, 2023 • 9

ElementBrawlerAI/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 28, 2023 • 5

MarkieMark1/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 29, 2023 • 7