Add OpenLLM Small Extended 6k model

OpenLLM Small Extended model trained for 6,000 steps.

- Model: GPT-style transformer (35.8M parameters)
- Training: 6,000 steps on SQUAD Wikipedia passages
- Tokenizer: SentencePiece BPE (32k vocabulary)
- License: GPL-3.0 / Commercial available

For more details, see: https://github.com/louischua/openllm

Files changed (1) hide show

README.md +36 -0

README.md CHANGED Viewed

@@ -1,3 +1,39 @@
 # OpenLLM Small Extended 6k
 This is the OpenLLM Small Extended model trained for 6,000 steps on Wikipedia passages from the SQUAD dataset.

+---
+language:
+- en
+license:
+- gpl-3.0
+- other
+tags:
+- text-generation
+- language-model
+- gpt
+- transformer
+- open-source
+- squad
+- wikipedia
+datasets:
+- squad
+metrics:
+- perplexity
+- text-generation-quality
+library_name: transformers
+pipeline_tag: text-generation
+model-index:
+- name: OpenLLM Small Extended 6k
+  results:
+  - task:
+      type: text-generation
+    dataset:
+      type: squad
+      name: SQUAD Wikipedia Passages
+    metrics:
+      - type: perplexity
+        value: 816.04
+      - type: training_loss
+        value: 5.4302
+---
 # OpenLLM Small Extended 6k
 This is the OpenLLM Small Extended model trained for 6,000 steps on Wikipedia passages from the SQUAD dataset.