--- base_model: Qwen2-0.5B-Instruct library_name: peft --- # ShiZhi 🤖[modelscope](https://modelscope.cn/models/freshman8888/LegalReasoningModel) ShiZhi(释之)是一个为中文刑事案件法院观点生成(Criminal Court View Generation, CVG)任务而设计的轻量级大语言模型。 其名称来源于历史人物张释之,在中文中,“释之”一词亦有“解释”“阐明”之意,非常契合法院文书中“法院认为”部分的生成任务。 ## Model Details ### 模型描述 基于 Qwen2-0.5B-Instruct 微调的大模型。使用的数据是自建的经过严格清洗的 1985-2021 年的裁判文书数据。 - **语言:** 中文 - **许可证:** Apache License 2.0 - **微调的模型:** Qwen2-0.5B-Instruct ## 开始使用 ```python import os os.environ['CUDA_VISIBLE_DEVICES'] = '0' from swift.llm import ( PtEngine, RequestConfig, safe_snapshot_download, get_model_tokenizer, get_template, InferRequest ) from swift.tuners import Swift # 请调整下面几行 model = 'Qwen/Qwen2-0.5B-Instruct' lora_checkpoint = safe_snapshot_download('TIM0927/ShiZhi') # 修改成checkpoint_dir template_type = None # None: 使用对应模型默认的template_type default_system = "你是一个法官,你需要根据裁判文书的事实部分,完成裁判文书的法院推理部分。" # None: 使用对应模型默认的default_system fact = "经审理查明,..." # 加载模型和对话模板 model, tokenizer = get_model_tokenizer(model) model = Swift.from_pretrained(model, lora_checkpoint) template_type = template_type or model.model_meta.template template = get_template(template_type, tokenizer, default_system=default_system) engine = PtEngine.from_model_template(model, template, max_batch_size=2) request_config = RequestConfig(max_tokens=512, temperature=0) infer_requests = [ InferRequest(messages=[{'role': 'user', 'content': f"事实描述:\n{fact}\n法院推理:\n"}]), ] resp_list = engine.infer(infer_requests, request_config) query0 = infer_requests[0].messages[0]['content'] print(f'response: {resp_list[0].choices[0].message.content}') ``` ## 训练细节 ### 训练数据 使用的数据是自建的经过严格清洗的 1985-2021 年的裁判文书数据,[CCVG](https://huggingface.co/datasets/TIM0927/CCVG)。 ### 框架版本 - PEFT 0.12.0 ## 引用 如果你觉得我们的文章对你有帮助,欢迎引用: ```bibtet @misc{hou2025shizhichineselightweightlarge, title={ShiZhi: A Chinese Lightweight Large Language Model for Court View Generation}, author={Zhitian Hou and Kun Zeng}, year={2025}, eprint={2510.09297}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2510.09297}, } ``` ## 模型免责声明 1. **用途限制**:本模型的开发与提供仅面向**学术研究场景**,旨在为相关领域的学术探索、技术验证及理论研究提供工具支持。严禁将本模型用于任何商业用途(包括但不限于产品开发、商业服务、盈利性活动等)、非法活动或违反法律法规与公序良俗的场景。 2. **结果有效性声明**:本模型生成的所有内容(包括文本、数据、结论等)均未经过系统性的人工校验与准确性审核,可能存在事实偏差、逻辑疏漏、信息滞后或表述歧义等问题。模型无法对生成内容的真实性、完整性、可靠性及适用性作出任何保证。 3. **偏好适配说明**:本模型的训练数据与优化目标未针对 “符合人类普遍偏好” 或 “满足特定群体主观需求” 进行专项设计,生成内容可能与不同用户的价值观、审美偏好、认知习惯存在差异,模型不保证生成结果符合任何个人或群体的主观预期。 4. **责任界定**:任何基于本模型生成内容所开展的后续行为(包括学术引用、决策参考、内容传播等),其风险与责任均由行为实施者自行承担。模型开发方不对因使用本模型内容而导致的任何直接或间接损失(包括但不限于学术失误、决策偏差、名誉损害等)承担责任。 5. **使用建议**:建议使用者在利用本模型生成内容时,结合自身专业知识与可靠信息源进行交叉验证,对内容的合理性、准确性进行独立判断,避免直接将模型输出作为唯一依据。