--- license: apache-2.0 tags: - finance - japanese - stock-prediction - sentence-transformers - gradient-boosting datasets: - kabu-disclosures-v1 metrics: - mean_absolute_error - r2 model-index: - name: jfinance-title2return-v1 results: - task: type: regression name: Stock Return Regression dataset: name: JP_Disclosure_Titles_2024Q3-2025Q2 type: custom metrics: - type: mean_absolute_error value: 2.94 - type: r2 value: -0.064 --- # jfinance-title2return-v1 日本株 **TDnet/EDINET 開示タイトル** から **翌営業日リターン (`ret_next`, %)** を推定する Gradient Boosting Regressor モデルです。 タイトル文は [`sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2`](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) (384 次元)にエンコードし、±25 % Winsorize 済みリターンを回帰ターゲットに学習しました。 --- ## Intended Uses & Limitations | ✔ 推奨用途 | ✘ 非推奨用途 | |-----------|-------------| | IR イベントドリブンの速報スクリーニング | 裁量なしの完全自動売買 | | 金融 NLP 研究・ベンチマーク | ETF/REIT での厳密な値動き予測 | | 個人投資家の材料整理 | 終値 < 1 円の超低位株 | > **注意**: 実際の投資判断に用いる際は必ず追加検証を行ってください。 --- ## Quick inference (one-liner) ```python from joblib import load from sentence_transformers import SentenceTransformer from huggingface_hub import hf_hub_download # download & load model reg = load(hf_hub_download("c299m/jfinance-title2return-v1", "model.joblib")) embed = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2") title = "AIマッチングサービスβ版リリースのお知らせ" pred = reg.predict(embed.encode([title]))[0] print(f"Predicted next-day return: {pred:.2f} %") ### Run with the helper script ```bashcd python predict_ret_next.py "NVIDIAと提携" #▶ loading models … #予測翌営業日リターン: 15.04 %