JetBrains-Research
/

PIPer-8B

@@ -1,19 +1,22 @@
 ---
-library_name: transformers
 datasets:
 - JetBrains-Research/PIPer-envbench-zeroshot-rl
 - JetBrains-Research/PIPer-SFT-2500-sharegpt
-base_model:
-- JetBrains-Research/Qwen3-8B-am
-pipeline_tag: text-generation
 license: mit
 ---
 <img src="https://github.com/JetBrains-Research/PIPer/blob/main/misc/piper-logo.png?raw=true" alt="PIPer Mascot" style="height: 6em">
 <h1>
   PIPer: On-Device Environment Setup via Online Reinforcement Learning
 </h1>
 <div align="center">
 [![Models](https://img.shields.io/badge/🤗%20Hugging%20Face-Models-orange.svg)](https://jb.gg/PIPer)
@@ -97,4 +100,4 @@ uv run piper/hparams_entrypoint.py +experiment=llm-reward --info config
 ## 📄 License
-This project is licensed under the MIT License - see the [LICENSE](LICENSE) file for details.

 ---
+base_model:
+- JetBrains-Research/Qwen3-8B-am
 datasets:
 - JetBrains-Research/PIPer-envbench-zeroshot-rl
 - JetBrains-Research/PIPer-SFT-2500-sharegpt
+library_name: transformers
 license: mit
+pipeline_tag: text-generation
 ---
 <img src="https://github.com/JetBrains-Research/PIPer/blob/main/misc/piper-logo.png?raw=true" alt="PIPer Mascot" style="height: 6em">
 <h1>
   PIPer: On-Device Environment Setup via Online Reinforcement Learning
 </h1>
+[Paper](https://huggingface.co/papers/2509.25455) | [Code](https://github.com/JetBrains-Research/PIPer)
 <div align="center">
 [![Models](https://img.shields.io/badge/🤗%20Hugging%20Face-Models-orange.svg)](https://jb.gg/PIPer)
 ## 📄 License
+This project is licensed under the MIT License - see the [LICENSE](LICENSE) file for details.