Migaku
initial model card & files
d161ef2
metadata
license: apache-2.0
tags:
  - finance
  - japanese
  - stock-prediction
  - sentence-transformers
  - gradient-boosting
datasets:
  - kabu-disclosures-v1
metrics:
  - mean_absolute_error
  - r2
model-index:
  - name: jfinance-title2return-v1
    results:
      - task:
          type: regression
          name: Stock Return Regression
        dataset:
          name: JP_Disclosure_Titles_2024Q3-2025Q2
          type: custom
        metrics:
          - type: mean_absolute_error
            value: 2.94
          - type: r2
            value: -0.064

jfinance-title2return-v1

日本株 TDnet/EDINET 開示タイトル から
翌営業日リターン (ret_next, %) を推定する Gradient Boosting Regressor モデルです。
タイトル文は sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
(384 次元)にエンコードし、±25 % Winsorize 済みリターンを回帰ターゲットに学習しました。


Intended Uses & Limitations

✔ 推奨用途 ✘ 非推奨用途
IR イベントドリブンの速報スクリーニング 裁量なしの完全自動売買
金融 NLP 研究・ベンチマーク ETF/REIT での厳密な値動き予測
個人投資家の材料整理 終値 < 1 円の超低位株

注意: 実際の投資判断に用いる際は必ず追加検証を行ってください。


Quick inference (one-liner)

from joblib import load
from sentence_transformers import SentenceTransformer
from huggingface_hub import hf_hub_download

# download & load model
reg  = load(hf_hub_download("c299m/jfinance-title2return-v1", "model.joblib"))
embed = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

title = "AIマッチングサービスβ版リリースのお知らせ"
pred  = reg.predict(embed.encode([title]))[0]
print(f"Predicted next-day return: {pred:.2f} %")

### Run with the helper script

```bashcd 
python predict_ret_next.py "NVIDIAと提携"

#▶ loading models …
#予測翌営業日リターン: 15.04 %