---
license: apache-2.0
tags:
  - finance
  - japanese
  - stock-prediction
  - sentence-transformers
  - gradient-boosting
datasets:
  - kabu-disclosures-v1
metrics:
  - mean_absolute_error
  - r2
model-index:
- name: jfinance-title2return-v1
  results:
  - task:
      type: regression
      name: Stock Return Regression
    dataset:
      name: JP_Disclosure_Titles_2024Q3-2025Q2
      type: custom
    metrics:
      - type: mean_absolute_error
        value: 2.94
      - type: r2
        value: -0.064
---

# jfinance-title2return-v1

日本株 **TDnet／EDINET 開示タイトル** から  
**翌営業日リターン (`ret_next`, %)** を推定する Gradient Boosting Regressor モデルです。  
タイトル文は [`sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2`](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2)  
（384 次元）にエンコードし、±25 % Winsorize 済みリターンを回帰ターゲットに学習しました。

---

## Intended Uses & Limitations

| ✔ 推奨用途 | ✘ 非推奨用途 |
|-----------|-------------|
| IR イベントドリブンの速報スクリーニング | 裁量なしの完全自動売買 |
| 金融 NLP 研究・ベンチマーク | ETF／REIT での厳密な値動き予測 |
| 個人投資家の材料整理 | 終値 < 1 円の超低位株 |

> **注意**: 実際の投資判断に用いる際は必ず追加検証を行ってください。

---

## Quick inference (one-liner)

```python
from joblib import load
from sentence_transformers import SentenceTransformer
from huggingface_hub import hf_hub_download

# download & load model
reg  = load(hf_hub_download("c299m/jfinance-title2return-v1", "model.joblib"))
embed = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

title = "AIマッチングサービスβ版リリースのお知らせ"
pred  = reg.predict(embed.encode([title]))[0]
print(f"Predicted next-day return: {pred:.2f} %")

### Run with the helper script

```bashcd 
python predict_ret_next.py "NVIDIAと提携"

#▶ loading models …
#予測翌営業日リターン: 15.04 %