Migaku

initial model card & files

d161ef2 5 months ago

2.23 kB

metadata

license: apache-2.0
tags:
  - finance
  - japanese
  - stock-prediction
  - sentence-transformers
  - gradient-boosting
datasets:
  - kabu-disclosures-v1
metrics:
  - mean_absolute_error
  - r2
model-index:
  - name: jfinance-title2return-v1
    results:
      - task:
          type: regression
          name: Stock Return Regression
        dataset:
          name: JP_Disclosure_Titles_2024Q3-2025Q2
          type: custom
        metrics:
          - type: mean_absolute_error
            value: 2.94
          - type: r2
            value: -0.064

jfinance-title2return-v1

日本株 TDnet／EDINET 開示タイトル から
翌営業日リターン (ret_next, %) を推定する Gradient Boosting Regressor モデルです。
タイトル文は sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
（384 次元）にエンコードし、±25 % Winsorize 済みリターンを回帰ターゲットに学習しました。

Intended Uses & Limitations

✔ 推奨用途	✘ 非推奨用途
IR イベントドリブンの速報スクリーニング	裁量なしの完全自動売買
金融 NLP 研究・ベンチマーク	ETF／REIT での厳密な値動き予測
個人投資家の材料整理	終値 < 1 円の超低位株

注意: 実際の投資判断に用いる際は必ず追加検証を行ってください。

Quick inference (one-liner)

from joblib import load
from sentence_transformers import SentenceTransformer
from huggingface_hub import hf_hub_download

# download & load model
reg  = load(hf_hub_download("c299m/jfinance-title2return-v1", "model.joblib"))
embed = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

title = "AIマッチングサービスβ版リリースのお知らせ"
pred  = reg.predict(embed.encode([title]))[0]
print(f"Predicted next-day return: {pred:.2f} %")

### Run with the helper script

```bashcd 
python predict_ret_next.py "NVIDIAと提携"

#▶ loading models …
#予測翌営業日リターン: 15.04 %