h2oai
/

h2ogpt-oasst1-falcon-40b

Text Generation

large language model

text-generation-inference

Model card Files Files and versions

arnocandel commited on Jun 7, 2023

Commit

eec5f6e

·

1 Parent(s): 8f10eef

commit files to HF hub

Files changed (1) hide show

README.md +18 -5

README.md CHANGED Viewed

@@ -44,8 +44,7 @@ import torch
 from transformers import pipeline, AutoTokenizer
 tokenizer = AutoTokenizer.from_pretrained("h2oai/h2ogpt-oasst1-falcon-40b", padding_side="left")
-generate_text = pipeline(model="h2oai/h2ogpt-oasst1-falcon-40b", tokenizer=tokenizer, torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto", prompt_type='human_bot')
 res = generate_text("Why is drinking water so healthy?", max_new_tokens=100)
 print(res[0]["generated_text"])
 ```
@@ -60,7 +59,7 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 tokenizer = AutoTokenizer.from_pretrained("h2oai/h2ogpt-oasst1-falcon-40b", padding_side="left")
 model = AutoModelForCausalLM.from_pretrained("h2oai/h2ogpt-oasst1-falcon-40b", torch_dtype=torch.bfloat16, device_map="auto")
-generate_text = H2OTextGenerationPipeline(model=model, tokenizer=tokenizer, prompt_type='human_bot')
 res = generate_text("Why is drinking water so healthy?", max_new_tokens=100)
 print(res[0]["generated_text"])
@@ -145,9 +144,23 @@ RWConfig {
 Model validation results using [EleutherAI lm-evaluation-harness](https://github.com/EleutherAI/lm-evaluation-harness).
-                TBD
 ## Disclaimer

 from transformers import pipeline, AutoTokenizer
 tokenizer = AutoTokenizer.from_pretrained("h2oai/h2ogpt-oasst1-falcon-40b", padding_side="left")
+generate_text = pipeline(model="h2oai/h2ogpt-oasst1-falcon-40b", tokenizer=tokenizer, torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto", prompt_type="human_bot")
 res = generate_text("Why is drinking water so healthy?", max_new_tokens=100)
 print(res[0]["generated_text"])
 ```
 tokenizer = AutoTokenizer.from_pretrained("h2oai/h2ogpt-oasst1-falcon-40b", padding_side="left")
 model = AutoModelForCausalLM.from_pretrained("h2oai/h2ogpt-oasst1-falcon-40b", torch_dtype=torch.bfloat16, device_map="auto")
+generate_text = H2OTextGenerationPipeline(model=model, tokenizer=tokenizer, prompt_type="human_bot")
 res = generate_text("Why is drinking water so healthy?", max_new_tokens=100)
 print(res[0]["generated_text"])
 Model validation results using [EleutherAI lm-evaluation-harness](https://github.com/EleutherAI/lm-evaluation-harness).
+[eval source code](https://github.com/h2oai/h2ogpt/issues/216#issuecomment-1579573101)
+|    Task     |Version| Metric |Value |   |Stderr|
+|-------------|------:|--------|-----:|---|-----:|
+|arc_challenge|      0|acc     |0.5196|±  |0.0146|
+|             |       |acc_norm|0.5461|±  |0.0145|
+|arc_easy     |      0|acc     |0.8190|±  |0.0079|
+|             |       |acc_norm|0.7799|±  |0.0085|
+|boolq        |      1|acc     |0.8514|±  |0.0062|
+|hellaswag    |      0|acc     |0.6485|±  |0.0048|
+|             |       |acc_norm|0.8314|±  |0.0037|
+|openbookqa   |      0|acc     |0.3860|±  |0.0218|
+|             |       |acc_norm|0.4880|±  |0.0224|
+|piqa         |      0|acc     |0.8194|±  |0.0090|
+|             |       |acc_norm|0.8335|±  |0.0087|
+|winogrande   |      0|acc     |0.7751|±  |0.0117|
 ## Disclaimer