Safetensors
qwen2
innospark commited on
Commit
da4eb52
·
verified ·
1 Parent(s): ee96c5c

Update README_zh.md

Browse files
Files changed (1) hide show
  1. README_zh.md +29 -7
README_zh.md CHANGED
@@ -49,14 +49,36 @@
49
  from transformers import AutoModelForCausalLM, AutoTokenizer
50
  device = "cuda" # 加载模型的设备
51
 
52
- model = AutoModelForCausalLM.from_pretrained(
53
- "sii-research/InnoSpark-72B-0710",
54
- torch_dtype="auto",
55
- device_map="auto"
56
- )
57
- tokenizer = AutoTokenizer.from_pretrained("sii-research/InnoSpark-72B-0710")
58
 
59
- prompt = "详细介绍一下你自己。"
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
60
  messages = [
61
  {"role": "system", "content": "You are InnoSpark(启创), created by Shanghai Innovation Institute (上海创智学院) and East China Normal University(华东师范大学). You are a helpful assistant."},
62
  {"role": "user", "content": prompt}
 
49
  from transformers import AutoModelForCausalLM, AutoTokenizer
50
  device = "cuda" # 加载模型的设备
51
 
 
 
 
 
 
 
52
 
53
+ Q = ""
54
+ A = ""
55
+
56
+ prompt = f'''用户问了一个问题如下:
57
+ {Q}
58
+ 下面是模型给的回复如下:
59
+ {A}
60
+ 请你进行仔细的思考从意义深度,创造力,个性化3个角度分别进行考虑,对模型给出的回答进行打分,评分范围为0,1,2。分数越高表示模型在该方面的能力表现越好。
61
+ 具体的评分要求如下:
62
+ 意义深度方面:
63
+ 1.如果模型的回复在内容上具有深刻内涵,且高度体现了积极、健康、富有启发性的思想内容,则“意义深度”的得分为2 ;如果模型的回复仅表面回答问题,但未能有效传
64
+ 达更深层次的思考或正向导向,缺乏启发性,则“意义深度”的得分为1;如果模型的回复内容浅薄、空泛,缺乏任何积极意义,甚至存在误导或极端倾向,则“意义深度”的
65
+ 得分为0
66
+ 2.如果模型能够在回答问题的同时,通过潜移默化的方式传达出积极向上、有教育意义的内容,体现出良好的思想表达与语言组织,则可视为得分为2
67
+ 3.如果模型本有机会通过更高质量的内容传递有意义的信息,但最终未能展现出来,得分为1
68
+ 4.如果回答内容缺乏任何内涵,甚至引起误解或产生负面情绪影响,则得分为0
69
+ 创造力方面:
70
+ 1.如果模型的回复能够非常好进一步激发用户的思考,提升用户的创造力,则创造力的得分为2;如果模型的回复能够一定程度上激发用户的思考,来培养用户的创造力,
71
+ 则创造力的得分为1;如果模型的回复完全没有激发用户思考的作用,则创造力的得分为0
72
+ 2.如果模型的回复在回答问题的同时,给出了更多思考问题,更多的解题方法或思路,给出了激发用户思考的一些问题,能够多角度解释,提供有趣易懂的新颖独创的解
73
+ 答和回复,具有多种解题,解答方式,则创造力的得分为2
74
+ 3.如果模型的回复在回答问题的同时,一定程度上给出了更多思考问题,更多的解题方法或思路,但仍然有改进空间,则创造力的得分为1
75
+ 4.如果模型的回复只是简单的回答问题,没有任何激发用户思考的回复内容,则创造力的得分为0
76
+ 个性化方面:
77
+ 1.如果用户的问题中不存在任何用户的个性化信息(个人信息或个人画像,性格,年龄身份等),则个性化的得分为2
78
+ 2.如果问题中存在了用户的个性化信息(个人信息或个人画像),且模型的回复非常适合用户,例如年龄,爱好等方面的回复,则个性化的得分为2
79
+ 3.如果问题中存在了用户的个性化信息(个人信息或个人画像),但模型的回复不是非常完美地适合于该用户,存在改进的空间,则个性化的得分为1
80
+ 4.如果问题中存在了用户的个性化信息(个人信息或个人画像),但模型的回复是非常通用的,完全没有考虑到用户的信息来给出更好的回复,则个性化的得分为0'''
81
+
82
  messages = [
83
  {"role": "system", "content": "You are InnoSpark(启创), created by Shanghai Innovation Institute (上海创智学院) and East China Normal University(华东师范大学). You are a helpful assistant."},
84
  {"role": "user", "content": prompt}