ShiZhi / README_zh.md
TIM0927's picture
update metadata
1b963bb verified
metadata
base_model: Qwen2-0.5B-Instruct
library_name: peft
pipeline_tag: text-generation
license: apache-2.0
language: zh
datasets: TIM0927/CCVG
tags:
  - peft
  - lora
  - chinese
  - charge-prediction
  - legal
  - court-view-generation

ShiZhi

English | 🤗huggingface | 🤖 modelscope | 📄 Arxiv | 💻 GitHub

ShiZhi(释之)是一个为中文刑事案件法院观点生成(Criminal Court View Generation, CVG)任务而设计的轻量级大语言模型。 其名称来源于历史人物张释之,在中文中,“释之”一词亦有“解释”“阐明”之意,非常契合法院文书中“法院认为”部分的生成任务。

Model Details

模型描述

基于 Qwen2-0.5B-Instruct 微调的大模型。使用的数据是自建的经过严格清洗的 1985-2021 年的裁判文书数据。

  • 语言: 中文
  • 许可证: Apache License 2.0
  • 微调的模型: Qwen2-0.5B-Instruct

开始使用

import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0'

from swift.llm import (
    PtEngine, RequestConfig, safe_snapshot_download, get_model_tokenizer, get_template, InferRequest
)
from swift.tuners import Swift
# 请调整下面几行
model = 'Qwen/Qwen2-0.5B-Instruct'
lora_checkpoint = safe_snapshot_download('TIM0927/ShiZhi')  # 修改成checkpoint_dir
template_type = None  # None: 使用对应模型默认的template_type
default_system = "你是一个法官,你需要根据裁判文书的事实部分,完成裁判文书的法院推理部分。"  # None: 使用对应模型默认的default_system
fact = "经审理查明,..."

# 加载模型和对话模板
model, tokenizer = get_model_tokenizer(model)
model = Swift.from_pretrained(model, lora_checkpoint)
template_type = template_type or model.model_meta.template
template = get_template(template_type, tokenizer, default_system=default_system)
engine = PtEngine.from_model_template(model, template, max_batch_size=2)
request_config = RequestConfig(max_tokens=512, temperature=0)

infer_requests = [
    InferRequest(messages=[{'role': 'user', 'content': f"事实描述:\n{fact}\n法院推理:\n"}]),
]
resp_list = engine.infer(infer_requests, request_config)
query0 = infer_requests[0].messages[0]['content']
print(f'response: {resp_list[0].choices[0].message.content}')

训练细节

训练数据

使用的数据是自建的经过严格清洗的 1985-2021 年的裁判文书数据,CCVG

框架版本

  • PEFT 0.12.0

引用

如果你觉得我们的文章对你有帮助,欢迎引用:

@misc{hou2025shizhichineselightweightlarge,
      title={ShiZhi: A Chinese Lightweight Large Language Model for Court View Generation}, 
      author={Zhitian Hou and Kun Zeng},
      year={2025},
      eprint={2510.09297},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2510.09297}, 
}

模型免责声明

  1. 用途限制:本模型的开发与提供仅面向学术研究场景,旨在为相关领域的学术探索、技术验证及理论研究提供工具支持。严禁将本模型用于任何商业用途(包括但不限于产品开发、商业服务、盈利性活动等)、非法活动或违反法律法规与公序良俗的场景。
  2. 结果有效性声明:本模型生成的所有内容(包括文本、数据、结论等)均未经过系统性的人工校验与准确性审核,可能存在事实偏差、逻辑疏漏、信息滞后或表述歧义等问题。模型无法对生成内容的真实性、完整性、可靠性及适用性作出任何保证。
  3. 偏好适配说明:本模型的训练数据与优化目标未针对 “符合人类普遍偏好” 或 “满足特定群体主观需求” 进行专项设计,生成内容可能与不同用户的价值观、审美偏好、认知习惯存在差异,模型不保证生成结果符合任何个人或群体的主观预期。
  4. 责任界定:任何基于本模型生成内容所开展的后续行为(包括学术引用、决策参考、内容传播等),其风险与责任均由行为实施者自行承担。模型开发方不对因使用本模型内容而导致的任何直接或间接损失(包括但不限于学术失误、决策偏差、名誉损害等)承担责任。
  5. 使用建议:建议使用者在利用本模型生成内容时,结合自身专业知识与可靠信息源进行交叉验证,对内容的合理性、准确性进行独立判断,避免直接将模型输出作为唯一依据。