Ransaka
/

sinhala-bert-medium-v2

Generated from Trainer

Model card Files Files and versions

Ransaka commited on Oct 3, 2023

Commit

fbc0693

·

1 Parent(s): ee5d78e

Update README.md

Files changed (1) hide show

README.md +18 -11

README.md CHANGED Viewed

@@ -1,22 +1,29 @@
 ---
-base_model: Ransaka/sinhala-bert-medium-v1
 tags:
 - generated_from_trainer
 model-index:
-- name: sinhala-bert-medium-v2
   results: []
 ---
-<!-- This model card has been generated automatically according to the information the Trainer had access to. You
-should probably proofread and complete it, then remove this comment. -->
-# sinhala-bert-medium-v2
-This model is a fine-tuned version of [Ransaka/sinhala-bert-medium-v1](https://huggingface.co/Ransaka/sinhala-bert-medium-v1) on an unknown dataset.
 ## Model description
-More information needed
 ## Intended uses & limitations
@@ -31,13 +38,13 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0001
-- train_batch_size: 128
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 2
 ### Training results

 ---
 tags:
 - generated_from_trainer
 model-index:
+- name: sinhala-bert-medium
   results: []
+widget:
+- text: "අපි තමයි [MASK] කරේ."
+- text: "මට හෙට එන්න වෙන්නේ [MASK]."
+- text: "අපි ගෙදර [MASK]."
+- text: 'සිංහල සහ [MASK] අලුත් අවුරුද්ද.'
+license: mit
+language:
+- si
 ---
+# sinhala-bert-medium
+This model is pretrained on Sinhala data srources.
 ## Model description
+    hidden_size = 786
+    num_hidden_layers = 6
+    num_attention_heads = 6
+    intermediate_size = 1024
 ## Intended uses & limitations
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
+- train_batch_size: 64
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 10
 ### Training results