Add verifyToken field to verify evaluation results are produced by Hugging Face's automatic model evaluator (#8)

- Add verifyToken field to verify evaluation results are produced by Hugging Face's automatic model evaluator (f15e2df316f03bf05de5724308ab38d2174120fb)

Co-authored-by: Evaluation Bot <[email protected]>

Files changed (1) hide show

README.md +14 -10

README.md CHANGED Viewed

@@ -1,12 +1,12 @@
 ---
 language: en
-datasets:
-- squad_v2
 license: cc-by-4.0
 tags:
 - deberta
 - deberta-v3
 - deberta-v3-large
 model-index:
 - name: deepset/deberta-v3-large-squad2
   results:
@@ -19,14 +19,16 @@ model-index:
       config: squad_v2
       split: validation
     metrics:
-    - name: Exact Match
-      type: exact_match
       value: 88.0876
       verified: true
-    - name: F1
-      type: f1
       value: 91.1623
       verified: true
   - task:
       type: question-answering
       name: Question Answering
@@ -36,14 +38,16 @@ model-index:
       config: plain_text
       split: validation
     metrics:
-    - name: Exact Match
-      type: exact_match
       value: 89.2366
       verified: true
-    - name: F1
-      type: f1
       value: 95.0569
       verified: true
 ---
 # deberta-v3-large for QA

 ---
 language: en
 license: cc-by-4.0
 tags:
 - deberta
 - deberta-v3
 - deberta-v3-large
+datasets:
+- squad_v2
 model-index:
 - name: deepset/deberta-v3-large-squad2
   results:
       config: squad_v2
       split: validation
     metrics:
+    - type: exact_match
       value: 88.0876
+      name: Exact Match
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiZmE0MWEwNjBkNTA1MmU0ZDkyYTA1OGEwNzY3NGE4NWU4NGI0NTQzNjRlNjY1NGRmNDU2MjA0NjU1N2JlZmNhYiIsInZlcnNpb24iOjF9.PnBF_vD0HujNBSShGJzsJnjmiBP_qT8xb2E7ORmpKfNspKXEuN_pBk9iV0IHRzdqOSyllcxlCv93XMPblNjWDw
+    - type: f1
       value: 91.1623
+      name: F1
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiZDBkNDUzZmNkNDQwOGRkMmVlZjkxZWVlMzk3NzFmMGIxMTFmMjZlZDcyOWFiMjljNjM5MThlZDM4OWRmNzMwOCIsInZlcnNpb24iOjF9.bacyetziNI2DxO67GWpTyeRPXqF1POkyv00wEHXlyZu71pZngsNpZyrnuj2aJlCqQwHGnF_lT2ysaXKHprQRBg
   - task:
       type: question-answering
       name: Question Answering
       config: plain_text
       split: validation
     metrics:
+    - type: exact_match
       value: 89.2366
+      name: Exact Match
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiMjQ1Yjk3YTdiYTY1NmYxMTI1ZGZlMjRkNTlhZTkyNjRkNjgxYWJiNDk2NzE3NjAyYmY3YmRjNjg4YmEyNDkyYyIsInZlcnNpb24iOjF9.SEWyqX_FPQJOJt2KjOCNgQ2giyVeLj5bmLI5LT_Pfo33tbWPWD09TySYdsthaVTjUGT5DvDzQLASSwBH05FyBw
+    - type: f1
       value: 95.0569
+      name: F1
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiY2QyODQ1NWVlYjQxMjA0YTgyNmQ2NmIxOWY3MDRmZjE3ZWI5Yjc4ZDE4NzA2YjE2YTE1YTBlNzNiYmNmNzI3NCIsInZlcnNpb24iOjF9.NcXEc9xoggV76w1bQKxuJDYbOTxFzdny2k-85_b6AIMtfpYV3rGR1Z5YF6tVY2jyp7mgm5Jd5YSgGI3NvNE-CQ
 ---
 # deberta-v3-large for QA